개발/etc30 자연어 언어모델 BERT 강의 1강 정리 강의 :[토크ON세미나] 자연어 언어모델 ‘BERT’ 1강 - 자연어 처리(NLP) | T아카데미 자연어 처리 방법 Symbolic approach 규칙/지식 기반 접근법으로 일일히 들어오는 입력에 대한 출력 값을 매핑해주는 방식 Statistical approach 확률/통계 기반 접근법 TF-IDF를 이용한 키워드 추출 딥러닝에 많이 적용되기 시작 전처리 개행문자 제거 특수문자 제거 공백 제거 중복 표현 제어 이메일, 링크 제거 제목 제거 불용어 (의미 없는 용어) 제거 조사 제거 띄어쓰기, 문장분리 보정 사전 구축 토크나이징 어절, 형태소, n-gram, WordPiece 토크나이징 우리나라는 어절이 아닌 형태소로 나누어야 최소 의미 단위 다양한 자연어 처리 App 문서 분류, 문법, 오타 교정, .. 개발/etc 2021. 11. 21. 텍스트 요약, Text Rank 란? 텍스트 요약 텍스트 요약에는 크게 **추출적 요약(Extractive Summarization)**과 **추상적 요약(Abstractive Summarization)**으로 나눠진다고 한다. 추출적 요약은 말 그대로 기존의 글에서 중요도가 높거나 핵심이 되는 문장 그대로 추출해서 요약글을 만드는 것이다. 즉, 새로운 단어가 생겨나거나 새로운 문장이 생성되지 않는 요약 방법이다. 반면, 추상적 요약은 새로운 단어와 새로운 문장을 생성해서 요약을 하는 방법이다. 추출적 요약과 추상적 요약에 대해 생각해보자면, 예를들어 학생한테 독후감 과제를 냈는데 한명은 중요한 문장 그대로만 뽑아서 그대로 써왔고, 다른 학생은 자기 나름대로 새로운 문장을 써서 요약을 해왔다면 뭔가 후자 학생에게 좀더 좋은 점수를 주었을 것.. 개발/etc 2021. 11. 21. [Python] Ubuntu 에서 PYTHONPATH 설정방법 Window 환경에서 Pythonpath 설정은 환경변수를 통해 변경이 가능하지만 Ubuntu에서는 적용이 안되는 것 같았다. 그럴 때는 간편하게 설정을 통해 바꿔줄 수 있다. 1. 우분투 환경에서 (나같은 경우 Windows Terminal) cd , nano .profile을 입력한다. 2. 그다음 출력된 창에 맨 밑으로 내려가서 export PYTHONPATH=본인이 원하는 위치:$PYTHONPATH 를 입력한다. 3. 그런 뒤 ctrl+x 를 누른 후 y를 누르고 엔터를 누르면 저장이 되고 그 후에 터미널에 echo $PYTHONPATH를 입력하면본인이 설정한 위치가 설정된 것을 볼 수 있다. 개발/etc 2021. 11. 21. 해커톤 준비 / GPT-3 이란? 와이즈넛 채용확정형 교육을 듣고 있는 도중 와이즈넛에서 AI 텍스트 요약 해커톤을 진행한다는 공지를 보았다. 같이 교육을 듣는 동료들과 함께 공부하고 도전해보자고 이야기를 나눈 뒤, 그 바탕이 될 지식들을 정리하며 공부하는 시간을 가지고자 한다. GPT-3 이란? openAI사가 개발한 인공 일반 지능 모델이다. Generative Pre-trained Transformer 3(GPT-3)은 딥러닝을 이용해 인간다 운 텍스트를 만들어내는 자기회귀 언어 모델이다. openAI사가 만든 GPT-n 시리즈의 3세대 언어 예측 모델이다. GPT-3의 전체버전은 1,750억개의 매개변수를 가지고 있어, 2020년 5월 도입된 이전버전 GPT-2보다 2배 이상 크다. GPT-3가 수행가능한 작업으로는 각종 언어 관.. 개발/etc 2021. 11. 18. [Git] fatal: remote origin already exists.오류 해결 git remote add origin 주소값 을 입력하면 fatal: remote origin already exists. 오류가 뜬다. 그런 경우에는 git remote rm origin 을 입력 후 다시 진행해주면 해결된다!! 개발/etc 2021. 10. 26. [Git] Git Bash 로 hub에 push하기 (Git hub에 내 코드 올리기) 업로드할 폴더 우클릭 후 git bash here git init → 엔터 git remote add origin 레파지토리 링크 git status → 엔터 git add ./원하는폴더명 → 엔터 git config --global user.email "이메일주소" → 엔터 git config --global user.name "이름" → 엔터 git commit -m "올릴 코드의 이름" git push origin master → 엔터 github 로그인 하면 완료 Git 브랜치 push 방법 git init git remote add origin https://github.com/~.git git pull origin 브랜치이름 git checkout -b 브랜치이름 git add ./ 원하는 폴.. 개발/etc 2021. 10. 17. 이전 1 2 3 다음