본문 바로가기

파이썬3

형태소 분석기 mecab 설치 (Mac os) 오늘은 한글 형태소 분석기 중에서 가장 많이 사용되고 있는 mecab 형태소 분석기 설치 방법에 대해서 알아보고자 합니다. 1. 먼저, 한글 형태소 분석을 위한 python을 설치합니다. python이 설치되어 있으신 분들은 이 부분을 넘어가고 설치가 안되어 있는 분들은 아래의 홈페이지를 통해 설치할 수 있습니다. https://www.python.org/downloads/ Download Python The official home of the Python Programming Language www.python.org 홈페이지에서 해당 OS에 해당하는 python을 다운로드하여 설치 (최신 버전을 설치하는 것보다는 Stable releases 버전으로 나온 python을 설치하는 것이 오류 없이 설치.. 2023. 5. 3.
[Python] CSV 파일 파이썬으로 열기 1. CSV 파일이란 무엇인가? 데이터 값들이 쉼표로 구분되는 텍스트 데이터 또는 텍스트 파일을 의미한다. 확장자는. csv로 이용되어집니다 MIME형식은 text/csv 이며, comma-sperated variables이라고 하기도 합니다. 2. Python 을 이용하여 CSV 파일을 읽어 들이는 방법 (2가지 방법) CSV라이브러리를 이용 pandas 라이브러리를 이용 3. CSV 라이브러리를 이용해서 CSV 파일 열기 아래와 같이 코드를 입력하면 csv파일을 읽어 들일 수 있다. import csv with open("/Users/python/META_station.csv", 'r') as file: csvreader = csv.reader(file) for row in csvreader: pri.. 2023. 1. 17.
[Python Mysql 이모지 저장 Error solution]: java.sql.SQLException: Incorrect string value: '\xF0\x9F\x98\x99 "...' for column 'DSC' at row 1 java.sql.SQLException: Incorrect string value: '\xF0\x9F\x98\x99 "...' for column 'DSC' at row 1 는 뉴스데이터 클롤링 과정에서 수집된 데이터를 mysql에 저장하는 과정에서 내용 중에 😙와 같은 이모지가 포함된 내용들을 저장하는 과정 중에 발생한다. 이를 해결하기 위한 방법으로는 1. 파이썬 정규 표현식을 이용하여 이모지 제거 방법 파이썬에서는 정규 표현식을 지원하기 위해 re(regular expression) 모듈을 제공한다. import re 를 통해 모듈을 임포트한 뒤, emoji_remove = re.compile('정규표현식')을 통해서 정규표현식을 컴파일하고, 컴파일된 패턴 객체(emoji_remove)를 이용하여 .. 2023. 1. 1.
반응형