
의사결정트리 (Decision Tree) 분류 문제(범주형 데이터 예측)에 사용 불확실성(uncertainty) 또는 불순도(impurity)가 크게 줄어들도록 학습 장점 상대적으로 이해가 쉽고 빠름 자료 가공이 대체로 불필요함 단점 연속형 데이터 예측이 어려움 모형이 복잡하면 예측률이 떨어짐 불순도 평가 방법 3가지 엔트로피 지니계수 카이제곱스퀘어 불순도 평가 방법 3가지 엔트로피(Entropy) 무질서도 필요한 모든 bit 수를 평균한 값 엔트로피가 작을수록 좋음(불순도 낮음) 불순도 희석 방향으로 데이터 나눔 log 사용으로 속도가 느림 지니계수(Gini Index) 1 - (랜덤한 특정 레코드가 같은 범주에 포함될 확률) 지니계수가 작을수록 좋음(불순도 낮음) 엔트로피 보다 속도 빠름 카이제곱스퀘..

머신러닝(Machine Learning) 기계가 스스로 데이터의 유의미한 패턴과 통계적인 함수를 발견하여 지식을 얻는 것을 말한다. 머신러닝의 분류 회귀 입력데이터를 바탕으로 원하는 타겟변수의 미래결과 예측 주식시장 예측, 백화점 수요예측 등 분류 입력데이터를 바탕으로 개별 데이터의 클래스 구분 스팸 필터링, 신용카드 사기 탐지, 제조 결함 탐지 등 추천 고객이 선호하는 상품 또는 대안 예측 유튜브 선호 영상 추천, 홈쇼핑 상품 추천 등 대체 입력데이터의 누락값 보완 불완전한 환자 의료 데이터 기록 보완, 인구조사 자료 보충 등 머신러닝의 방법론 지도학습 (Supervised Learning) 훈련 데이터 안에 예측해야 할 target이 있는 경우에 사용되는 방법론 비지도학습 (Unsupervised L..

안녕하세요. 개발개입니다. 2002회 리눅스마스터(1급) 시험을 준비하게 되어 시험정보와 학습내용을 정리하고 공유하고자 합니다. 시험 정보 리눅스 실무의 이해 리눅스의 개요 [현재글] 리눅스 시스템의 이해 네트워크의 이해 리눅스 시스템 관리 일반 운영 관리 장치 관리 시스템 보안 및 관리 네트워크 및 서비스의 활용 네트워크 서비스 네트워크 보안 01 운영체제의 개요 운영체제의 목적 처리능력 향상 Throughput : 일정 시간 동안 처리하는 일의 양 응답시간 최소화 Turnaround : 시스템에 작업 요청 후 결과가 얻어질 때까지 걸리는 시간 신뢰도 향상 Reliability : 주어진 문제를 정확히 처리하는 정도 사용가능도 향상 Availability : 이용할 수 있는 시스템 자원의 정도 운영체제..