516d44081dad2a3b4749562615e1480807202957
- BM25로 데이터 검색 - 유사도 검색 - 질문 + 문서를 보내 질문과 관련 내용만 추출LLMChainExtractor - pdf ocr이 없는 경우 이미지로 변환하여 ocr처리하여 텍스트 인식 - 정규식으로 데이터 정제
Description
AI Study
Languages
Jupyter Notebook
94.9%
Python
4.8%
JavaScript
0.2%
HTML
0.1%