책소개
이 책은 인공지능을 개발하기 위해 알아야 할 기본 개념과 방법을 담은 1부(1-6장)와 개발 실전 사례를 담은 2부(7-8장)로 구성되어 있다. 2부에는 실제로 정형 데이터와 비정형 데이터를 활용하여 인공지능 모형을 개발한 과정을 담아 독자들이 체계적으로 학습할 수 있도록 하였다. 1장에는 인공지능 개발 절차, 데이터의 수집과 분류, 미래신호 탐색에 대한 내용을 기술하였다. 2장에는 인공지능 개발 프로그램인 R의 설치 및 활용 방법을 기술하였다. 3장에는 인공지능의 개념과 학습방법에 대해 기술하였다. 4장에는 머신러닝의 지도학습 알고리즘인 나이브 베이즈 분류모형, 로지스틱 회귀모형, 랜덤포레스트 모형, 의사결정나무 모형, 신경망 모형, 서포트벡터머신 모형으로 인공지능을 모델링하는 전 과정을 기술하였다. 5장에는 인공지능 모형 평가를 위한 오분류표와 ROC 곡선에 대해 기술하였다. 6장에는 1-5장까지의 학습을 바탕으로 코로나19 정보확산 위험예측 인공지능을 개발하는 전 과정을 기술하였다. 7장에는 정형 데이터를 활용한 청소년 범죄지속 위험예측 인공지능 개발 과정을 기술하였다. 8장에는 비정형 데이터를 활용하여 마약 위험예측 인공지능 개발 과정을 기술하였다.
목차
part 1 인공지능 개발방법론
ch 1 인공지능 개발 방법
1 인공지능 개발 필요성
2 인공지능 개발 절차
3 인공지능 개발을 위한 데이터 수집 및 분류
3-1 데이터 수집
3-2 데이터 분류
3-3 연구윤리
4 인공지능 학습데이터 생성
5 미래신호 탐색
5-1 미래신호 탐색 방법
5-2 코로나19 주요 요인의 단어빈도와 문서빈도 분석
5-3 코로나19 주요 요인의 미래신호 탐색
5-4 결론 및 고찰
ch 2 R의 설치와 활용
1 R의 설치와 활용
1-1 R 설치
1-2 R 활용
ch 3 인공지능 개념과 학습방법
1 인공지능 개념
2 인공지능 학습방법
3 인공지능 개발 시 고려사항
4 인공지능 학습데이터
ch 4 인공지능 모델링
1 나이브 베이즈 분류모형
2 로지스틱 회귀모형
3 랜덤포레스트 모형
4 의사결정나무 모형
5 신경망 모형
5-1 ‘nnet’ 패키지 사용
5-2 ‘neuralnet’ 패키지 사용
6 서포트벡터머신 모형
7 연관분석
7-1 입력변수 간 연관분석
7-2 입력변수와 출력변수 간 연관분석
ch 5 인공지능 모형 평가
1 오분류표를 활용한 모형 평가
1-1 오분류표 평가 시 고려사항
1-2 오분류표를 활용한 양질의 학습데이터 생성
2 ROC 곡선을 활용한 모형 평가
3 오분류표를 활용한 코로나19 정보확산 위험예측 인공지능 모형 평가
3-1 나이브 베이즈 분류모형 평가
3-2 신경망 모형 평가
3-3 로지스틱 회귀모형 평가
3-4 서포트벡터머신 모형 평가
3-5 랜덤포레스트 모형 평가
3-6 의사결정나무 모형 평가
4 ROC 곡선을 활용한 코로나19 정보확산 위험예측 인공지능 모형 평가
4-1 나이브 베이즈 분류모형 ROC
4-2 신경망 모형 ROC
4-3 로지스틱 회귀모형 ROC
4-4 서포트벡터머신 모형 ROC
4-5 랜덤포레스트 모형 ROC
4-6 의사결정나무 모형 ROC
ch 6 코로나19 정보확산 위험예측 인공지능 개발
1 인공지능 모형 평가
2 최적 모형을 이용한 출력변수 예측
2-1 신경망 모형을 활용한 출력변수 예측
2-2 랜덤포레스트 모형을 활용한 출력변수 예측
3 원데이터와 예측데이터의 출력변수를 활용한 양질의 학습데이터 생성
3-1 신경망 모형을 활용한 양질의 학습데이터 생성
3-2 랜덤포레스트 모형을 활용한 양질의 학습데이터 생성
4 머신러닝을 활용한 코로나19 정보확산 위험예측 인공지능 개발
4-1 신경망 모형을 적용한 코로나19 정보확산 위험예측 인공지능 개발
4-2 랜덤포레스트 모형을 적용한 코로나19 정보확산 위험예측 인공지능 개발
5 입력변수가 출력변수에 미치는 영향력 산출
part 2 인공지능 개발 실전
ch 7 정형 데이터를 활용한 인공지능 개발: 청소년 범죄지속 위험예측 인공지능 개발
1 청소년 범죄지속 위험예측 인공지능 개발의 필요성
2 청소년 범죄지속 위험예측 인공지능 학습데이터 생성
3 청소년 범죄지속 위험예측 인공지능 개발
3-1 인공지능 모형 평가
3-2 최적 모형을 이용한 출력변수 예측
3-3 원데이터와 예측데이터의 출력변수를 활용한 양질의 학습데이터 생성
3-4 머신러닝을 활용한 청소년 범죄지속 위험예측 인공지능 개발
3-5 입력변수가 출력변수에 미치는 영향력 산출
ch 8 비정형 데이터를 활용한 인공지능 개발: 마약 위험예측 인공지능 개발
1 마약 위험예측 인공지능 개발의 필요성
2 마약 소셜 빅데이터 분석 방법
2-1 마약 소셜 빅데이터 분석 절차
2-2 마약 소셜 빅데이터 수집 및 분류
3 마약 미래신호 탐색
4 마약 위험예측 인공지능 개발
4-1 인공지능 모형 평가
4-2 최적 모형을 이용한 출력변수 예측
4-3 원데이터와 예측데이터의 출력변수를 활용한 양질의 학습데이터 생성
4-4 머신러닝을 활용한 마약 위험예측 인공지능 개발
4-5 입력변수가 출력변수에 미치는 영향력 산출
저자소개
출판사리뷰
머신러닝 학습데이터의 수집 및 분류부터 인공지능 개발까지,
인공지능 개발의 전 과정을 체계적으로 제시한 책
최근 전 세계적으로 각광받고 있는 인공지능(AI, Artificial Intelligence)은 다양하고 방대한 빅데이터를 학습하여 인간의 학습능력과 추론능력, 지각능력, 자연언어의 이해능력 등을 컴퓨터 프로그램으로 실현한 기술이다. 방대한 데이터를 인공지능의 한 분야인 머신러닝으로 학습하여 인공지능(모형)을 개발하는 방법은 연구자들로 하여금 다양한 변인들의 관계를 보다 정확히 파악하고 예측할 수 있도록 이끌어준다. 미국 Open AI의 생성형 인공지능 챗봇(Chatter Robot)인 ChatGPT의 성능은 ChatGPT가 학습한 매개변수(파라미터)의 개수가 중요하며 ChatGPT-3는 약 1,750억 개의 매개변수를 기반으로 개발되었다. 즉 적합한 머신러닝 알고리즘으로 매개변수가 포함된 데이터를 학습하여야 좋은 결과를 예측하는 인공지능을 개발할 수 있다.
머신러닝을 활용해 인공지능을 개발하려면 몇 가지 과정을 거쳐야 한다. 우선 머신러닝 알고리즘으로 인공지능 모형을 평가한 후, 선정된 최적 모형을 이용하여 출력변수를 예측해야 한다. 그런 다음 원데이터와 예측데이터의 출력변수를 활용하여 양질의 학습데이터를 생성하고, 마지막으로 양질의 학습데이터를 이용하여 인공지능을 개발해야 한다.
이 책은 머신러닝 학습 데이터의 수집 및 분류부터 인공지능 개발까지, 인공지능 개발을 위한 전 과정을 체계적으로 안내한다. 통계지식이 부족한 독자들도 쉽게 따라할 수 있도록 개발 단계별로 본문을 구성하고 상세히 기술하였다. 책에 수록된 인공지능 개발 사례는 정형 데이터와 비정형 데이터를 대상으로 하였으며, 인공지능 개발에 사용된 모든 프로그램은 오픈소스 프로그램인 R을 사용하였다.
구성 및 주요 내용
이 책은 인공지능을 개발하기 위해 알아야 할 기본 개념과 방법을 담은 1부(1-6장)와 개발 실전 사례를 담은 2부(7-8장)로 구성되어 있다. 2부에는 실제로 정형 데이터와 비정형 데이터를 활용하여 인공지능 모형을 개발한 과정을 담아 독자들이 체계적으로 학습할 수 있도록 하였다.
1장에는 인공지능 개발 절차, 데이터의 수집과 분류, 미래신호 탐색에 대한 내용을 기술하였다. 2장에는 인공지능 개발 프로그램인 R의 설치 및 활용 방법을 기술하였다. 3장에는 인공지능의 개념과 학습방법에 대해 기술하였다. 4장에는 머신러닝의 지도학습 알고리즘인 나이브 베이즈 분류모형, 로지스틱 회귀모형, 랜덤포레스트 모형, 의사결정나무 모형, 신경망 모형, 서포트벡터머신 모형으로 인공지능을 모델링하는 전 과정을 기술하였다. 5장에는 인공지능 모형 평가를 위한 오분류표와 ROC 곡선에 대해 기술하였다. 6장에는 1-5장까지의 학습을 바탕으로 코로나19 정보확산 위험예측 인공지능을 개발하는 전 과정을 기술하였다. 7장에는 정형 데이터를 활용한 청소년 범죄지속 위험예측 인공지능 개발 과정을 기술하였다. 8장에는 비정형 데이터를 활용하여 마약 위험예측 인공지능 개발 과정을 기술하였다.