-
Stability AI가 StableLM, ogether가 RedPajama라는 완전한 공개형 모델을 공개머신러닝_MachineLearning_AI/ChatGPT❤️활용하기 2023. 4. 24. 11:20728x902023-04-17 ~ 2023-04-23 사이의 주요 뉴스들
한 달쯤 전에 "LLM에 Stable Diffusion Moment가 오고 있다"는 제목으로 언어 모델에도 오픈소스에 의한 혁신이 오고 있다는 말씀을 드렸는데요. LLaMA/Alpaca 등은 공개이긴 하지만, 상업적인 이용이 불가능한 반개방형 모델이어서 연구목적 이외의 용도로는 사용하는 게 어렵습니다. 이번 주에는 Stability AI가 StableLM, ogether가 RedPajama라는 완전한 공개형 모델을 공개하였습니다. StableLM은 CC-BY-SA 라이센스로 출처 표기 시 상업적 이용도 가능하며, Alpaca/Dolly 등 5개의 대화형 데이터세트를 이용하여 파인튜닝 한 모델도 공개하였습니다. 또한, RedPajama는 LLaMA 논문에 설명된 레시피를 그대로 따라서 1.2조 개의 토큰으로 구성한 완전 개방형 데이터 세트입니다. OpenAI의 ChatGPT API를 활용하기에 부담이 되거나, 자신이 필요한 확장 및 개선을 할 수 있는 곳에서는 좋은 대안이 될 듯한데요. 빠르게 프로토타이핑할 때는 OpenAI API를 쓰고, 실제 프로덕션 런칭 후에 상황을 보고 대체하거나 하는 것도 가능하지 않을까 생각합니다. "프로덕션용 LLM 어플리케이션 구축하기" 글도 같이 참고하세요.
프로덕션용 LLM 어플리케이션 구축하기 | GeekNews
LLM으로 쿨한 것을 만드는 것은 쉽지만, 프로덕션 수준으로 만드는 것은 매우 어려움LLM 어플리케이션을 제품화 하기 위해 풀어야 하는 주요 과제들, 여러 태스크를 제어흐름내에 통합하는 방법
news.hada.io
ogether가 RedPajama라는 완전한 공개형 모델을 공개
RedPajama - LLaMA 데이터셋을 재작성하는 오픈소스 프로젝트 | GeekNews
LLaMA, Alpaca, Vicuna 같은 반개방형 모델이 아니라 재현가능하고 완전한 개방형 언어 모델을 만들기 위한 프로젝트3가지 구성요소높은 품질과 넓은 커버리지를 가진 Pre-Training 데이터이 데이터 기반
news.hada.io
StableLM 공개 - Stability AI의 공개 언어 모델 | GeekNews
3B/7B 모델을 공개, 15B/30B/65B 모델도 공개 예정이고 175B까지 계획중모델은 CC BY-SA-4.0 라이센스로 출처 표기시 상업적 이용 가능오픈 데이터셋인 The Pile에 기반했지만 3배 크기인 1.5T 토큰을 가지는
news.hada.io
"LLM에 Stable Diffusion Moment가 오고 있다"
[GN#193] LLM에 Stable Diffusion Moment가 오고 있다 | GeekNews
이번 주는 AI에 있어서 10년 같은 1주였다고 얘기할 정도로 많은 것들이 쏟아져서 어떤 기사를 제목으로 사용할까 엄청나게 고민했는데요. OpenAI의 GPT-4 부터, Meta의 LLaMA를 52K Instruction-Following 데이
news.hada.io
반응형'머신러닝_MachineLearning_AI > ChatGPT❤️활용하기' 카테고리의 다른 글
한국 상륙한 구글 AI 챗봇 바드 써보니… (0) 2023.04.26 테슬라는 자율주행이란 문제를 어떻게 풀고 있나? ② (0) 2023.04.26 Programming with Google Bard - 구글 바드 이용 프로그래밍 하기 (0) 2023.04.26 Bing AI 업데이트 내용 번역(파파고 번역기 사용) (0) 2023.04.26 AI NPC로 진행한 충격적인 게임연구(실험)결과 (0) 2023.04.21 ChatGPT. Powershell 생성해줘. 근데 난 아무것도 몰라. (0) 2023.04.19 코파일럿에 이어 CodeWhisperer까지! 코딩 너무 쉬워진다! (0) 2023.04.19 대규모 언어 모델(LLM, Large Language Model) (0) 2023.04.18