728x90
반응형
오늘은 한글 형태소 분석기 중에서 가장 많이 사용되고 있는 mecab 형태소 분석기 설치 방법에 대해서 알아보고자 합니다.
1. 먼저, 한글 형태소 분석을 위한 python을 설치합니다. python이 설치되어 있으신 분들은 이 부분을 넘어가고 설치가 안되어 있는 분들은 아래의 홈페이지를 통해 설치할 수 있습니다.
- 홈페이지에서 해당 OS에 해당하는 python을 다운로드하여 설치 (최신 버전을 설치하는 것보다는 Stable releases 버전으로 나온 python을 설치하는 것이 오류 없이 설치가 가능
- 설치 프로그램을 실행하여 아래와 같이 컴퓨터에 설치
- 설치가 완료되면 터미널에서 python3 -V 또는 python -V 통해 설치된 파이선 버전 확인
2. 먼저 한글형태소 분석기가 가능한 konlpy 설치하기
- 터미널에서 pip install konlpy를 이용하여 한글 형태소 패키지 설치
- 맥에서 konlpy설치할때 JPype1 error 문제가 발생하면 아래와 순서와 같이 패키지 설치
conda install -c conda-forge jpype1
pip install konlpy
반응형
3. 기본 한글 형태소 패키지가 설치가 되면 이제는 Mecab을 이용한 한글 형태소 분석이 가능하도록 mecab패키지 설치하기
- mecab 설치 전 자동 설치를 실행할 수 있는 autoconf, automake libtool 프로그램을 터미널을 통해 설치
> brew install autoconf automake libtool
- 터미널을 통해 다운받은 폴더 위치로 이동 후 압축을 해제하고 압축해제된 위치로 이동하여 mecab설치 (아래 순서 참조)
1 > tar xvfz mecab-0.996-ko-0.9.2.tar.gz (압축해제하기)
2 > cd mecab-0.996-ko-0.9.2.tar.gz (압축해제된 위치로 이동하기)
3 > sudo ./configure (confiture 실행하기)
4 > make
5 > sudo make install
-
https://bitbucket.org/eunjeon/mecab-ko-dic/downloads/ 에서 한글 사전인 mecab-ko-dic-2.1.1-20180720.tar.gz 파일을 다운로드
- 터미널을 통해 다운받은 폴더 위치로 이동 후 압축을 해제하고 압축해제된 위치로 이동하여 mecab 한글용 사전 설치 (아래 순서 참조)
1 > tar xzfv mecab-ko-dic-2.1.1-20180720.tar.gz (압축파일 압축 풀기)
2 > cd mecab-ko-dic-2.1.1-20180720 (압축이 풀린 위치로 이동)
3 > sudo ./autogen.sh
4 > sudo ./configure
5 > make
6 > sudo make install
- 파이썬에서 mecab을 실행할 수 있는 실행파일 설치하기
1 > git clone http://bitbucket.org/eunjeon/mecab-python-0.996.git (파이선 실행을 위한 파일 다운로드)
2 > cd mecab-python-0.996 (다운로드 받은 위치로 이동)
3 > python setup.py build
4 > python setup.py install
4. 모든 설치가 완료되면 Jupyter를 실행하여 mecab이 제대로 설치되어 있는지 확인해 보기
> jupyter lab (주피터 실행)
728x90
반응형
'Programming > 파이썬 (Python)' 카테고리의 다른 글
[Python] CSV 파일 파이썬으로 열기 (0) | 2023.01.17 |
---|---|
[Mac] Crontab 오류 Solution (4) | 2023.01.06 |
[Python] Crontab을 이용한 자동 Python 실행 등록하기 (Mac) (0) | 2023.01.03 |
[Python] Schedule (Mac OS) (0) | 2023.01.02 |
[Python Mysql 이모지 저장 Error solution]: java.sql.SQLException: Incorrect string value: '\xF0\x9F\x98\x99 "...' for column 'DSC' at row 1 (0) | 2023.01.01 |
댓글