​『핸즈온 머신러닝』 맛보기

Page 70

TIP

여러분은 잘 훈련된 데이터 과학자이므로 첫 번째로 할 일은 머신러닝 프로젝트 체크리스트를 준비하는 것입

니다. 부록 B에 준비한 것을 사용해도 됩니다. 대부분의 머신러닝 프로젝트에 잘 들어맞지만 필요에 따라 수정하는 것이 좋습니다. 이 장에서는 체크리스트에 있는 많은 항목을 다루겠지만 스스로 충분히 이해할 수 있는 항목이나 다 음 장에서 논의할 항목은 건너뛰겠습니다.

2.2.1 문제 정의 상사에게 첫 번째로 할 질문은 ‘비즈니스의 목적이 정확히 무엇인가요? ’입니다. 아마도 모델 만 들기가 최종 목적은 아닐 것입니다. 회사에서는 이 모델을 어떻게 사용해 이익을 얻으려고 할까 요? 이는 문제를 어떻게 구성할지, 어떤 알고리즘을 선택할지, 모델 평가에 어떤 성능 지표를 사 용할지, 모델 튜닝을 위해 얼마나 노력을 투여할지 결정하기 때문에 아주 중요한 질문입니다. 상사가 이 모델의 출력(구역의 중간 주택 가격에 대한 예측)이 여러 가지 다른 신호 signal 3와 함 께 다른 머신러닝 시스템(그림 2-2 )에 입력으로 사용된다고 이야기합니다. 뒤따르는 시스템이 해당 지역에 투자할 가치가 있는지 결정합니다. 이 결정이 수익에 직결되기 때문에 올바르게 예 측하는 것은 매우 중요합니다. 그림 2-2 부동산 투자를 위한 머신러닝 파이프라인 나의 컴포넌트

상위 컴포넌트

다른 신호들

구역 가격 결정

구역 데이터

투자 분석

구역 가격

투자

3 머신러닝 시스템에 주입하는 정보를 클로드 섀넌(Claude Shannon )의 정보 이론을 따라 종종 신호라고 부릅니다. 신호/잡음 비율이 높 은 것이 좋습니다. 옮긴이_ 섀넌은 미국의 수학자이자 전기공학자로 디지털 회로 이론을 창시하였고 정보 이론의 아버지로 불립니다.

70

1부 머신러닝


Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.