2025년 7월 24일 작성
AI - 인공 지능
AI는 인간의 학습과 추론 능력을 computer가 모방할 수 있도록 하는 기술로, image 인식, 언어 처리, 예측 분석 등 다양한 지적 영역에서 활용되고 있습니다.
AI : 인간의 지능을 모방하고 확장하는 기술
- AI(Artificial Intelligence)는 인간의 사고 과정을 computer가 모방할 수 있도록 하는 기술입니다.
- 학습, 추론, 문제 해결, 언어 이해 등 인간 고유의 인지 능력을 machine이 수행하도록 합니다.
- 단순한 계산이나 정해진 규칙 실행을 넘어서, 상황에 적응하고 판단하는 능력을 갖추고 있습니다.
- 현재 AI는 특정 영역에서 인간을 뛰어넘는 성능을 보이며 다양한 산업 분야에서 혁신을 이끌고 있습니다.
- image 인식, 언어 번역, 게임, 의료 진단 등에서 인간 전문가 수준 이상의 결과를 달성하고 있습니다.
- 자율 주행, 개인 맞춤 추천, 창작 활동 등 일상 생활 전반에 깊숙이 스며들고 있습니다.
AI의 핵심 개념과 정의
- AI의 기본 목표는 intelligent behavior를 computer system에서 구현하는 것입니다.
- 환경을 인식하고, 목표를 설정하며, 최적의 행동을 선택하는 능력을 machine에게 부여합니다.
- 인간의 뇌가 정보를 처리하는 방식을 수학적 model로 근사하려고 시도합니다.
Intelligence의 정의
- intelligence는 복잡한 환경에서 목표를 달성하는 능력으로 정의됩니다.
- 새로운 상황에 적응하고, 경험으로부터 학습하며, 추상적 사고를 수행하는 것을 포함합니다.
- 단순 암기나 반복 작업이 아닌, 창의적이고 유연한 문제 해결 능력을 의미합니다.
- Turing Test는 machine intelligence를 평가하는 고전적인 기준입니다.
- 인간이 machine과 대화할 때 상대방이 machine인지 구분하지 못하면 intelligent하다고 판단합니다.
- 하지만 이 test는 겉으로 드러나는 행동만 평가하므로, 진정한 이해나 의식을 측정하지는 못합니다.
- 현대적 평가 방법은 specific task에서의 성능을 객관적으로 측정합니다.
- benchmark dataset을 사용하여 정확도, 속도, robustness 등을 정량화합니다.
- human-level performance를 기준으로 AI system의 능력을 비교 평가합니다.
AI와 관련 개념들의 구분
- AI, Machine Learning, Deep Learning은 포함 관계에 있습니다.
- AI는 가장 넓은 개념으로 intelligent behavior를 구현하는 모든 기술을 포함합니다.
- Machine Learning은 AI의 하위 분야로 data로부터 pattern을 학습하는 방법입니다.
- Deep Learning은 Machine Learning의 한 분야로 neural network를 사용하는 기법입니다.
- Algorithm과 AI의 차이점을 명확히 구분해야 합니다.
- 전통적인 algorithm은 명확한 rule과 procedure를 따라 문제를 해결합니다.
- AI는 불완전하거나 모호한 정보에서도 reasonable한 판단을 내릴 수 있습니다.
- AI는 경험을 통해 성능이 향상되지만, 일반적인 algorithm은 변하지 않습니다.
AI의 동작 원리
- AI system의 핵심은 data에서 pattern을 찾아내고 이를 새로운 상황에 적용하는 것입니다.
- 대량의 example을 통해 규칙을 스스로 발견하고 일반화합니다.
- 명시적으로 programming되지 않은 상황에서도 적절한 response를 생성할 수 있습니다.
Machine Learning의 기본 원리
- machine learning은 명시적인 programming 없이 data로부터 pattern을 학습하는 방법입니다.
- 전통적인 programming은 입력과 algorithm을 주면 출력이 나오는 방식입니다.
- machine learning은 입력과 출력을 주면 algorithm(model)을 자동으로 찾아내는 방식입니다.
- 지도 학습(supervised learning)은 정답이 주어진 data에서 규칙을 학습합니다.
- email spam 분류에서는 spam이라고 label된 email들의 특징을 학습합니다.
- 새로운 email이 들어오면 학습된 pattern을 바탕으로 spam 여부를 판단합니다.
- 비지도 학습(unsupervised learning)은 정답 없이 data의 숨겨진 구조를 발견합니다.
- customer 구매 data에서 비슷한 성향의 고객 group을 자동으로 찾아냅니다.
- clustering, dimensionality reduction 등의 기법을 사용합니다.
- 강화 학습(reinforcement learning)은 시행착오를 통해 최적의 행동을 학습합니다.
- 게임에서 승리하거나 높은 점수를 얻을 때마다 보상을 받고, 그 행동을 강화합니다.
- 실패했을 때는 벌점을 받아 해당 행동을 피하도록 학습합니다.
Neural Network와 Deep Learning
- neural network는 인간의 뇌 구조를 모방한 computing model입니다.
- neuron에 해당하는 node들이 연결되어 network를 구성합니다.
- 각 connection은 weight를 가지며, 이 weight들이 학습을 통해 조정됩니다.
- deep learning은 여러 layer를 가진 neural network를 사용하는 기법입니다.
- “deep”이라는 이름은 hidden layer가 많다는 의미에서 유래했습니다.
- layer가 깊어질수록 더 복잡하고 추상적인 feature를 학습할 수 있습니다.
- representation learning이 deep learning의 핵심 장점입니다.
- raw data에서 meaningful feature를 자동으로 추출합니다.
- 전통적인 방법에서는 human expert가 수작업으로 feature를 설계해야 했습니다.
- end-to-end learning으로 전체 system을 하나의 network로 학습시킬 수 있습니다.
AI의 주요 유형과 분류
- AI는 능력의 범위와 구현 방식에 따라 다양하게 분류됩니다.
- 각 유형마다 고유한 특성과 적용 분야를 갖고 있습니다.
- 현재 대부분의 AI는 특정 task에 특화된 narrow AI에 해당합니다.
능력 범위에 따른 분류
- Narrow AI(Weak AI)는 특정 task에만 특화된 AI입니다.
- image 인식, 음성 인식, 게임 등 한정된 영역에서만 동작합니다.
- 현재 상용화된 거의 모든 AI system이 이 category에 속합니다.
- 지정된 task에서는 인간을 뛰어넘는 성능을 보이지만, 다른 영역으로는 전혀 transfer되지 않습니다.
- General AI(Strong AI)는 인간처럼 다양한 영역에서 사고할 수 있는 AI입니다.
- 한 영역에서 학습한 지식을 다른 영역에 적용할 수 있는 transfer learning 능력을 갖습니다.
- common sense reasoning과 creative problem solving이 가능합니다.
- 아직 실현되지 않았으며, 언제 가능할지 전문가들 사이에도 의견이 분분합니다.
- Super AI는 모든 영역에서 인간을 뛰어넘는 가상적인 AI입니다.
- 과학적 발견, 예술적 창작, 전략적 사고 등 모든 면에서 인간보다 우수합니다.
- 현재로서는 science fiction의 영역이지만, 일부 연구자들은 가능성을 논의하고 있습니다.
기술적 접근 방식에 따른 분류
- Symbolic AI는 logic과 symbol manipulation을 기반으로 합니다.
- knowledge representation과 reasoning을 통해 문제를 해결합니다.
- expert system, rule-based system 등이 대표적인 예시입니다.
- 명확한 reasoning process를 갖고 있어 설명이 가능하지만, real-world의 복잡성을 다루기 어렵습니다.
- Connectionist AI는 neural network를 기반으로 합니다.
- pattern recognition과 statistical learning에 특화되어 있습니다.
- deep learning, machine learning 등 현재 주류 AI가 이 category에 속합니다.
- 복잡한 data pattern을 잘 처리하지만, reasoning process가 불투명합니다.
- Hybrid AI는 symbolic과 connectionist approach를 결합합니다.
- neural-symbolic system으로 두 방식의 장점을 활용하려고 시도합니다.
- explainable AI와 robust reasoning을 목표로 하는 차세대 AI 연구 방향입니다.
AI의 주요 응용 분야
- AI 기술은 거의 모든 산업과 생활 영역에서 혁신을 일으키고 있습니다.
- 각 분야의 특성에 맞는 specialized AI solution들이 개발되고 있습니다.
- 기존 business model을 완전히 바꾸거나 새로운 서비스를 가능하게 만듭니다.
Computer Vision 응용
- image 인식과 분석이 다양한 분야에서 활용되고 있습니다.
- medical imaging에서 X-ray, MRI 판독을 보조하여 진단 정확도를 높입니다.
- autonomous vehicle에서 도로 상황을 실시간으로 인식하고 판단합니다.
- manufacturing에서 제품 품질 검사와 defect detection을 자동화합니다.
- facial recognition이 보안과 편의성을 동시에 향상시키고 있습니다.
- smartphone unlock, building access control 등에서 password를 대체합니다.
- retail store에서 customer identification과 personalized service를 지원합니다.
- augmented reality가 digital 정보를 현실 세계에 겹쳐서 보여줍니다.
- 교육에서 interactive 학습 경험을 생성합니다.
- gaming과 entertainment에서 몰입형 content를 만들어냅니다.
Natural Language Processing 응용
- 대화형 AI가 customer service와 개인 비서 역할을 담당합니다.
- chatbot이 24시간 고객 문의를 처리하고 문제를 해결합니다.
- 음성 비서가 smart home 제어와 정보 검색을 지원합니다.
- 언어 번역이 global 소통의 장벽을 해소하고 있습니다.
- 실시간 번역이 국제 business와 여행을 편리하게 만듭니다.
- 다국어 content 생성이 global 시장 진출을 용이하게 합니다.
- contents 생성이 창작 산업에 새로운 가능성을 열어주고 있습니다.
- 자동화된 journalism이 sports, 금융 등의 분야에서 news 기사를 생성합니다.
- 창작 보조 도구가 작가와 marketer의 작업을 보조합니다.
Business Intelligence와 Analytics
- 예측 분석(predictive analytics)이 business 의사 결정을 지원합니다.
- 매출 예측으로 재고 관리와 생산 계획을 최적화합니다.
- 고객 행동 예측으로 맞춤형 marketing과 retention 전략을 수립합니다.
- 추천 system이 개인화의 핵심 engine 역할을 합니다.
- e-commerce platform에서 개인 맞춤형 상품 추천을 담당합니다.
- streaming service에서 사용자 취향에 맞는 content를 선별합니다.
- fraud detection이 financial security를 강화하고 있습니다.
- unusual transaction pattern을 실시간으로 감지하여 금융 범죄를 예방합니다.
- identity verification과 risk assessment를 자동화합니다.
AI 학습과 개발 과정
- AI system 개발은 data 수집부터 deployment까지의 체계적인 과정을 거칩니다.
- 각 단계가 최종 성능에 큰 영향을 미치므로 신중한 설계와 실행이 필요합니다.
- iterative process를 통해 지속적으로 개선하고 최적화합니다.
Data Collection과 Preprocessing
- 고품질 data는 AI 성공의 핵심 요소입니다.
- “garbage in, garbage out” 원칙에 따라 data 품질이 model 성능을 결정합니다.
- 충분한 양과 다양성을 갖춘 representative data가 필요합니다.
- data cleaning과 preprocessing이 전체 개발 시간의 상당 부분을 차지합니다.
- missing value 처리, outlier 제거, normalization 등의 작업을 수행합니다.
- data augmentation으로 제한된 data를 확장하고 model의 generalization을 향상시킵니다.
- data labeling은 supervised learning에서 가장 비용이 많이 드는 작업입니다.
- human annotator가 수작업으로 label을 부여해야 합니다.
- active learning, semi-supervised learning 등으로 labeling cost를 줄이려는 연구가 활발합니다.
Model Training과 Optimization
- model architecture 선택이 성능의 기초를 결정합니다.
- task의 특성에 맞는 appropriate architecture를 선택해야 합니다.
- CNN은 image, RNN은 sequence, Transformer는 language task에 적합합니다.
- hyperparameter tuning을 통해 model 성능을 최적화합니다.
- learning rate, batch size, network depth 등의 parameter를 조정합니다.
- grid search, random search, bayesian optimization 등의 기법을 사용합니다.
- regularization으로 overfitting을 방지합니다.
- dropout, weight decay, early stopping 등의 technique을 적용합니다.
- validation set을 사용하여 generalization performance를 monitoring합니다.
Evaluation과 Deployment
- comprehensive evaluation을 통해 model의 실제 성능을 검증합니다.
- test set에서의 성능뿐만 아니라 robustness, fairness도 평가합니다.
- edge case와 adversarial example에 대한 stress testing을 수행합니다.
- production deployment에서는 performance와 scalability를 고려해야 합니다.
- inference latency, memory usage, computational cost를 최적화합니다.
- model serving infrastructure와 monitoring system을 구축합니다.
- continuous learning으로 deployed model을 지속적으로 개선합니다.
- new data로 model을 update하고 performance drift를 monitoring합니다.
- A/B testing을 통해 model improvement를 검증합니다.
Reference
- https://www.britannica.com/technology/artificial-intelligence
- https://www.coursera.org/learn/machine-learning
- https://www.deeplearningbook.org/
- https://ai.google/education/
- https://www.mit.edu/~amini/intro/
- https://www.nature.com/subjects/machine-learning