2026년 1월 8일 작성

Machine Learning - 스스로 학습하는 기계

machine learning은 data를 통해 pattern을 학습하고, 학습된 model로 예측이나 결정을 내리는 AI의 한 분야입니다.

Machine Learning : Data로부터 학습하는 Algorithm

  • machine learning(기계 학습)은 computer가 data를 통해 스스로 학습하여 문제를 해결하는 algorithm을 연구하는 분야입니다.
    • data를 통해 model을 학습(train)시키고, 그 model로 새로운 data에 대한 결과를 예측(test)합니다.
    • 학습 data는 입력 data와 그에 대한 정답인 label로 구성됩니다.
  • machine learning은 big data 처리, 복잡한 문제 해결, 예측 model 구축 등 다양한 분야에서 활용됩니다.
    • 의료 : 환자의 건강 상태 예측, 질병 진단
    • 금융 : 주가 예측, 사기 탐지
    • 자동화 : 자율 주행, 음성 인식, 얼굴 인식

Machine Learning의 종류

  • machine learning은 학습 방식에 따라 supervised learning, unsupervised learning, reinforcement learning으로 분류됩니다.
mindmap
    machine_learning((Machine Learning))
        supervised_learning(Supervised Learning)
            regression(Regression)
                advertising_popularity_prediction[Advertising Popularity Prediction]
                weather_forecasting[Weather Forecasting]
                market_forecasting[Market Forecasting]
                estimating_life_expectancy[Estimating life expectancy]
                population_growth_prediction[Population Growth Prediction]
            classification(Classification)
                idenity_fraud_detection[Idenity Fraud Detection]
                image_classification[Image Classification]
                customer_retention[Customer Retention]
                diagnostics[Diagnostics]
        unsupervised_learning(Unsupervised Learning)
            clustering(Clustering)
                recommender_systems[Recommender Systems]
                targetted_marketing[Targetted Marketing]
                customer_segmentation[Customer Segmentation]
            demensionality_reduction(Demensionality Reduction)
                big_data_visualisation[Big Data Visualisation]
                meaningful_compression[Meaningful Compression]
                structure_discovery[Structure Discovery]
                feature_elicitation[Feature Elicitation]
        reinforcement_learning(Reinforcement Learning)
            realtime_decisions[Real-time decisions]
            robot_navigation[Robot Navigation]
            learning_tasks[Learning Tasks]
            skill_acquisition[Skill Acquisition]
            game_ai[Game AI]

Supervised Learning

  • supervised learning(지도 학습)은 label이 있는 학습 data를 사용하는 학습 방법입니다.
    • 입력 data와 정답(label)이 함께 주어지며, 이를 통해 model을 학습시킵니다.
    • 학습된 model은 새로운 입력 data에 대한 예측을 수행합니다.
flowchart LR

data((날씨 Data))
data --> regression[[회귀]] --> regression_result(내일의 온도)
data --> classification[[분류]] --> classification_result(내일이 더운지 추운지)
  • regression(회귀)은 연속적인 값을 예측합니다.
    • 물건의 가격, 학생의 성적, 기온 등 숫자 값을 예측합니다.
  • classification(분류)은 data를 category로 나눕니다.
    • 결과가 두 가지인 경우를 binary classification(이진 분류)이라 합니다.
    • 결과가 세 가지 이상인 경우를 multiclass classification(다중 분류)이라 합니다.

Unsupervised Learning

  • unsupervised learning(비지도 학습)은 label이 없는 학습 data를 사용하는 학습 방법입니다.
    • 입력 data만 주어지며, data의 pattern이나 구조를 찾아내는 것이 목표입니다.
    • 찾아낸 pattern이나 구조를 통해 새로운 입력 data를 해석합니다.
  • clustering(군집화)은 data에서 특징을 찾아 여러 group으로 묶습니다.
    • 고객 segmentation, 추천 system 등에 활용됩니다.
  • dimension reduction(차원 축소)은 data의 특징 수를 줄입니다.
    • data를 가장 잘 표현하는 핵심 특징들만 추출합니다.

Reinforcement Learning

  • reinforcement learning(강화 학습)은 고정된 data 없이 기계의 경험을 통해 학습합니다.
    • 기계가 특정 상태(state)에서 행동(action)을 취하면 환경으로부터 보상(reward)을 받습니다.
    • 상태, 행동, 보상으로 구성된 dataset을 직접 생성하며 학습합니다.
  • 보상 설계와 환경 탐험 방식에 따라 학습 결과가 크게 달라집니다.
    • 보상 설계가 적절하면 방대한 data 없이도 기계 스스로 학습이 가능합니다.
    • 신뢰 할당 문제(credit assignment problem), 탐색-이용 딜레마(exploration-exploitation dilemma) 등 설계가 어렵습니다.

Reference


목차