HAE-RAE Bench
·
LLM
HAE-RAE Bench는 언어 모델의 한국어 능력을 평가하기 위해 제작된 벤치마크 데이터셋입니다. 여러 언어 모델이 공개되면서 한국어만 하는 언어 모델이 필요한가에 대한 논의가 활발해지고 있는데, HAE-RAE Bench는 이에 대한 가이드를 주고자 합니다. 이는 한국어의 고유한 특성과 지식을 반영한 Instruction 데이터셋입니다. 한국어 어휘, 독해, 문법과 지식, 총 4가지 영역에 걸쳐 언어 모델의 능력을 평가하는 벤치마크입니다.    평가 메트릭으로는 log-likelihood를 사용했습니다. 각 답변에 대해 log-likelihood를 계산하여 가장 높은 likelihood를 선택하는 방식입니다.    출처https://arxiv.org/abs/2309.02706https://github..
M1 Mac brew install 오류
·
Etc
brew install [package name] 터미널에서 명령어를 수행하면 다음과 같은 오류가 발생합니다. Error: Cannot install under Rosetta 2 in ARM default prefix (/opt/homebrew)! To rerun under ARM use: arch -arm64 brew install ... To install under x86_64, install Homebrew into /usr/local. 이는 intel과 m1의 경로차이 때문에 생기는 오류입니다. 앞에 arch -arm64를 붙이면 해결하실 수 있습니다. arch -arm64 brew install [pacakge name]
[Clean Code] 1장 깨끗한 코드
·
Data Science
프로그래밍은 기계가 실행할 정도로 상세하게 요구사항을 명시하는 작업이며, 이렇게 명시한 결과가 바로 코드다. 궁극적으로 코드는 요구사항을 표현하는 언어이다. 르블랑의 법칙(leblanc's Law): 나중에 코드를 정리하겠다고 하지만, 나중은 결코 오지 않는다.나쁜 코드가 샇일수록 팀 생산성은 떨어진다.요구사항 변경, 일정 등의 핑계를 대나, 잘못은 전적으로 프로그래머에게 있다.빨리 가는 유일한 방법은 언제나 코드를 최대한 깨끗하게 유지하는 습관이다.비야네 스트롭스트룹(C++ 창시자)보는 사람에게 즐거움을 선사해야 한다.속도 뿐만 아니라 CPU 자원을 낭비하지 않는 코드오류 없이 세세한 사항까지 꼼곰하게 처리하는 코드한 가지를 잘하는 코드그래드 부치잘 쓴 문장처럼 읽힌다.설계자의 의도를 숨기지 않는다.추..