-
[Mecab] 일본어 형태소 분석하기 :: Mecab
Mecab으로 일반 텍스트 일본어 형태소 분석하기 ! pip install mecab-python3 ! pip install unidic !python -m unidic download import MeCab import unidic tagger = MeCab.Tagger() # "tagger = MeCab.Tagger('-d ' + unidic.DICDIR)" sample_txt = 'くるまでまつ' result = tagger.parse(sample_txt) print (result) sample_txt에 원하는 문장을 입력하면 くる 動詞,非自立可能,,,カ行変格,連体形-一般,クル,来る,くる,クル,くる,クル,和,"","","","","","",用,クル,クル,クル,クル,"1","C1","",28911744..
🖥️ IT, 컴퓨터/🐍 Python
2024. 4. 3.
-
[빅데이터] 데이터 마트(Data Mart), 데이터 웨어하우스(Data Warehouse), 데이터 레이크(Data Lake) 차이
데이터 마트(Data Mart), 데이터 웨어하우스(Data Warehouse), 그리고 데이터 레이크(Data Lake)는 모두 조직에서 데이터를 저장하고 관리하기 위해 사용되는 기술 및 아키텍처입니다. 이들은 각각 다른 목적과 특성을 가지고 있으며, 데이터의 저장, 처리, 분석 방식에서 차이를 보입니다. 데이터 마트(Data Mart) 데이터 마트는 조직 내 특정 부서나 사용자 그룹의 특정 요구를 충족시키기 위해 설계된 데이터의 집합입니다. 이는 보다 작은 규모로, 특정 주제나 분야(예: 재무, 판매, 인사)에 초점을 맞추고 있습니다. 데이터 마트는 데이터 웨어하우스에서 파생된 것으로, 웨어하우스에서 추출한 데이터를 기반으로 구축될 수 있으며, 사용자가 필요한 정보에 더 빠르고 쉽게 접근할 수 있도록..
🖥️ IT, 컴퓨터/📁 데이터 분석
2024. 3. 31.