Python 한글처리

By | 2020-04-17

 

 

한국어 인공지능I

Python으로 시작하는 한글 처리

박건숙 저, 노드미디어

파이썬 한글 처리기 소스 코드 다운로드: t2bot_pyhangul

처음으로 프로그래밍을 시작하는 개발자를 위한 한글 코드 및 한글 처리 프로그래밍 기초와 응용

 

  • 한글의 기본 원리
  • 한글의 공학 원리
  • 한글 코드와 유니코드의 원리
  • 파이썬 한글 처리 프로그래밍
  • 데이터 과학으로서 한글 처리 응용 방법
  • 한글 공학 원리 완전 정복
  • 유니코드 완전 정복
  • 옛한글 처리 완전 정복

 

 

책소개

이 책이 속한 분야

  • 컴퓨터/IT , 프로그래밍 언어, Python(파이썬)
  • 컴퓨터공학, 인공지능, 인공지능일반
  • 대학교재

 

인공지능은 새로운 시대를 여는 기술로 자리잡았다. 인간과 대화하고 인간의 감정을 이해하는 언어 인공지능으로 발전하고 있다. 언어 인공지능은 언어와 소프트웨어의 융합이다. 〈한국어 인공지능〉 시리즈는 한글의 문자 체계와 코드 시스템을 시작으로 인공신경망이 융합된 한글 처리 시스템의 구현 방법까지 소개함으로써 한글 처리의 기본 원리를 이해하고, 한글 프로그래밍을 구현 및 응용할 수 있는 능력을 키우는 데에 목적을 두었다.
제1권 파이썬으로 시작하는 한글 처리는 첫 번째 책으로 한국어와 한글 코드에 대한 이론적 기초를 제공하고 파이썬으로 한글 처리 시스템을 구현하는 방법을 소개한다. 한글 처리의 기초적인 과정을 예제를 중심으로 설명하여 파이썬을 처음 공부하는 초보자도 쉽게 따라할 수 있도록 하였다.1부에서는 한글의 문자 체계와 공학 원리를 상세히 설명하고 한글 코드의 원리와 발전 과정, 유니코드의 한글 코드 영역에 대해 소개한다. 2부에서는 한글 처리를 위한 파이썬 프로그래밍의 기초를 소개한다. 프로그래밍을 처음 공부하는 독자들을 위하여 예제와 소스 코드를 중심으로 쉽게 설명한다. 3부에서는 파이썬으로 단어 추출, 정렬, 자모 처리 등의 한글 데이터 처리의 필수 기능을 프로그래밍하는 방법에 대해 설명한다. 현대어와 옛한글, 영어 문서인 CNN 뉴스와 영문 소설 등을 대상으로 언어 처리 결과를 제시하여 데이터 과학으로의 응용 및 활용 방법을 제시한다.
한글의 공학적 원리와 한글 코드 역사에 대한 상세한 내용은 한글 공학 전문가를 꿈꾸는 독자들에게 크게 도움이 될 것이다.

 

 

 

 

 

목차

PART 1 컴퓨터와 한글

Chapter 01 컴퓨터와 언어
1. 컴퓨터의 언어
2. 컴퓨터와 코드

Chapter 02 문자 코드
1. 컴퓨터의 저장 단위
2. 문자 코드와 문자 인코딩

Chapter 03 한글과 한글 코드
1. 한글 자모와 음절
2. 한글 코드의 역사와 종류
3. N바이트 한글 코드
4. 표준 완성형 코드
5. 표준 조합형 코드
6. 통합 완성형 코드

Chapter 04 유니코드와 한글
1. 유니코드
2. 유니코드의 한글 영역
3. 음절형 한글 코드
4. 자모형 한글 코드
5. 유니코드와 한글 처리
6. 유니코드와 한자

PART 2 한글 처리를 위한 파이썬(Python) 기초
Chapter 05 파이썬 기초
1. 파이썬 설치
2. 파이썬 개발 환경
3. 파이썬 코딩의 시작
4. 변수 선언

Chapter 06 파이썬 자료형
1. 문자열 처리
2. 문자열 처리 응용
3. 목록(list) 처리
4. 사전(dict) 처리

PART 3 파이썬(Python) 한글 처리

Chapter 07 단어와 토큰
1. 단어
2. 토큰

Chapter 08 문자 영역과 토큰
1. 한자 토큰
2. 영문자 토큰
3. 일본어 문자 토큰
4. 그리스 문자와 키릴 문자 토큰
5. 분리 문자와 기호 문자 토큰

Chapter 09 한글 토큰
1. 한글 음절
2. 한글 자모

Chapter 10 파이썬을 이용한 토큰 처리
1. 문자 영역 확인
2. 문자 영역의 토큰 변환
3. 토큰의 합성
4. 한글 자모와 옛한글 음절의 토큰 처리

Chapter 11 파이썬을 이용한 단어 처리
1. 단어 추출
2. 단어 목록 정렬
3. 사전(dict)형 정렬과 통계

Chapter 12 파이썬을 이용한 한글 자모 및 옛한글 처리
1. 음절의 자모 변환
2. 자모의 음절 변환
3. 자모 추출과 검색
4. 자모 정렬과 통계

PART 4 부 록

1. t2bot 한글 처리기
2. ‘훈민정음 해례’ 통계
3. ‘훈민정음 해례’ 용례

 

 

 

 

출판사 서평

닥치고 인공지능? 한글 코드부터 시작하는 인공지능!
최근 인공지능에 대한 열기가 매우 뜨겁다. 컴퓨터 공학과 SW 분야에서는 인공지능을 빼면 대화가 불가능할 정도이다. 또한 오픈소스 프로젝트 덕분에 다양한 개발 도구와 소스 코드를 활용하여 웬만한 프로젝트는 어렵지 않게 배울 수 있다. 그래서 ‘닥치고 인공지능’이 유행이다. 일단 인공지능부터 시작하고 마무리는 인공지능으로 결론이 난다.
그러나 레고처럼 소스 코드를 조립하여 거대한 탑을 쌓고, 매뉴얼대로 복잡한 구조물을 흉내 낸다고 해서 인공지능 전문가가 되는 것은 아니다. 이것은 단지 매뉴얼을 읽고 따라하는 것이다. 인공지능 전문가는 책에 나오는 예제가 아니라 새로운 상황에서 창의적으로 문제를 해결하는 방법은 스스로 찾아야 한다. 예제와 매뉴얼을 벗어나면 어디서 답을 찾을 것인가?

 

인공지능의 양대 산맥 중에 하나인 언어 인공지능은 이제 막 시작된 분야이다. 언어 인공지능은 언어와 소프트웨어가 융합된 분야이다. 한국어 인공지능은 다양한 컴퓨터공학 이론과 인공신경망 이론은 물론 언어 체계에 대한 이해가 필수이다. 그러나 최근 인공지능과 관련된 교재 대부분은 오픈소스를 매뉴얼식으로 조립하는 방법에 대한 소개가 주류를 이루고 있다. 언어와 관련된 내용은 대부분 생략되거나 외부 프레임워크를 호출하여 간단하게 조작하는 방법만 제시될 뿐 기본 원리를 명확하게 설명하거나 가르쳐주는 책이 없다.

 

이 책은 한국어 인공지능을 시작하는 독자를 위해서 준비한 것으로, 한국어 인공지능을 구현하기 전에 기본적으로 알아야 할 한국어 프로그래밍을 위한 이론서이자 응용서이다. 〈한국어 인공지능〉 시리즈는 한글의 문자 체계와 코드 시스템을 시작으로 인공신경망이 융합된 한글 처리 시스템의 구현 방법까지 소개함으로써 한글 처리의 기본 원리를 이해하고, 한글 프로그래밍을 구현 및 응용할 수 있는 능력을 키우는 데에 목적을 두었다. 이론과 예제는 물론 책에서 제공하는 한글 프로그래밍 소스 코드는 한글 프로그래밍을 직접 구현해 보고자 하는 독자들에게 큰 도움이 될 것이다. 

 

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

Time limit is exhausted. Please reload CAPTCHA.