우리는 AI 개발자들에 의한, AI 개발자들을 위한 최고의 성장 환경을 만들어갑니다. 우리가 만든 지식과 문화가 우리 뒤를 걷는 사람들을 위한 길이 되어줄 거에요.
함께해요! 지원자 링크
우리의 모토: ⭐ 풀스택 LLM 개발자! 에게 필요한 내용 전부 다뤄보자. 매주 깃잔심만 따라와도 공부 끝!! ** disclaimer: 주제별 지형을 얕게 파악한다는 뜻입니다! 배움에는 끝이 없어요 함께해요! 지원자 링크
LLM 관련 이론을 실제 프로젝트에 직접 적용해봅니다. 프로젝트 진행 상황을 정기적으로 발표하며 서로 피드백을 나눕니다.
- NLx 크루의 운영진들은 모두 반드시 자신만의 프로젝트를 기획하고, 러너를 모집해 같이 만듭니다.
- 이 프로젝트 그룹은 각자 도메인이나 만드는 기능에 맞는 스터디를 따로 진행합니다.
- 그 스터디에서 찾은 내용들을 수요일에 빌더가 대표로 공유하고, 또 핸드북에다가 업로드합니다.
- 기본적으로 프로젝트 참여를 권장합니다. 만들지 않으면 자기 것이 아니에요! 하고 싶지 않으신 분들은, 지식 기여 트랙으로 지원해주세요.
- 모든 크루원들은 새로운 소식 모으기나, 각자 회사/연구 하면서 알게 된 지식을 수요일에 가져와 공유합니다.
- 지식은 기여하고 싶지만 프로젝트 만들기는 원하지 않는 분들은 이 트랙으로 참여하여 공유합니다.
- 우리 크루는 매주 수요일에 전부 모입니다. 이 모임 (=깃헙에 NLP 잔디심기, 깃잔심)은 지식 기여자와 프로젝트 빌더/참여자가 다 같이 모이는 자리입니다.
- 모든 빌더들이 필참하여야 하고, 크루는 참여를 권장합니다. 지식 기여자분들은 개인이 찾아낸 것들을, 빌더들은 각 팀별로 찾아낸 소식과 결과물들을 요약하고 다 같이 다뤄보는 시간이 될 겁니다. (아직은 시스템이 잡히지 않았지만요).
- 빌더들이 모이는 자리인만큼, 스터디 운영 관해서도 이야기 나누고 점검합니다.
우리는 이번 주 LLM 소식들을 모으는 데이터 파이프라인을 만들었습니다. 여기서 수집된 내용을 멤버들끼리 나누어 커버합니다. 추가로, 각자 일하고 연구하며 찾게 된 내용들을 더해 공유합니다. 사각이 없이, 놓치는 큼직한 소식이 없게끔 매주 현실과 동기화하는 게 목표입니다.
파이프라인을 통해 수집한 소식들을 참여자들에게 조금씩 나눠 줍니다. 참여자들은 매주 일요일에 할당된 소식을 받고, 수요일까지 의무적으로 정리하고 평가하여 올려줍니다.
가장 임팩트가 높은 소식이나 도구, 논문들을 따로 정리합니다. 뉴스레터 형태로 배포하고, 핸드북에 등재됩니다.
스터디원 간 서로 독려하고 지켜봐주며 열정을 잃지 않도록 합니다. 시즌 중간 & 마지막에 모여서 놀러갑니다. 완성은 책임감에서, 책임감은 애착에서 나와요. 친해지는 만큼 동기부여도 협력도 잘 됩니다!
빌더들은 그 주에 팀이 만든 것들을 로그로 만듭니다. 매주 진행사항을 서로 보여줍니다!
참여자들은 배운 내용과 프로젝트 결과를 체계적으로 기록하고 공유합니다. 이를 통해 LLM 커뮤니티에 기여하면서, 참가자들도 능력을 뽐낼 수 있습니다.
열심히 공부를 했지만 아웃풋이 없으면 알아주지 않습니다! 공부 다 한 다음 포장해서 세상에 내놓읍시다. 좋은 자리로 가는 준비까지 함께 해요
- learning in public의 중요성: how to get tech jobs 영상 참고 https://www.youtube.com/watch?v=Xg9ihH15Uto
꽉 찬 잔디 잔디, SNS 브랜딩, 그리고 포트폴리오까지 시즌 마무리와 함께 완성이 되어 있게 됩니다.
함께해요! 지원자 링크
함께해요! 지원자 링크
함께해요! 지원자 링크
지금까지 잘 읽어오신 분들이라면 용어가 다소 헷갈릴 수가 있습니다. ‘아니 리서치 팀은 뭐고 스터디는 또 뭐지? ‘ ‘NLX Crew는 뭐고 깃잔심은 또 뭘까’ 이 문서는 그런 혼동을 딱 정리하는 글입니다.
차분히 읽어보시고, 꼭 지원해주세요! 지원자 링크
- **가짜연구소 (Pseudo Lab)**는 머신러닝, 데이터, AI 하는 사람들이 모인 비영리 공동체입니다.
- 2020년부터 활동하고 있어요!
- ‘성장이 멈추는 불편한 순간들을‘ 극복하기 위한 노력을 모토로 삼아, 끊임없이 학습하는 사람들이 모여 이루어진 공간입니다.
- 가짜연(=’슈도랩’ 이라고도 부릅니다)의 메인 컨텐츠는 ‘아카데믹 프로젝트’로, 쉽게 말하면 스터디 그룹들입니다.
- AI/ML/DS 하위 주제들에 대해, 하고 싶은 사람이 스터디를 개설합니다.
- 이때 총대를 메고 스터디를 기획 개설하는 운영하는 분들을 아카데믹 빌더라고 부릅니다.
- 현재 가짜연에는 (30)개의 스터디 그룹이 개설되어 있으며, 6개의 리서치 팀이 있습니다. 이 그림에서 작은 네모가 개별 스터디 그룹입니다. 그 작은 네모들을 감싸고 있는 큰 네모가 있는데, 이게 리서치 팀입니다.
- 리서치 팀은 가짜연 내 해당 분야에 특화된 그룹으로, 보통 여러 개의 하위 스터디가 개설됩니다.
- 현재 주제로는 추천 시스템 팀, 허깅페이스를 중심으로 NLP를 다루는 팀, 인과추론 팀, 3D 비전 팀 등이 있습니다.
- 모여서 공부하다 보면 메인 그룹에서 다루지 못한 다양한 주제에 대한 아쉬움이 생겨요. 이걸 소그룹으로 나눠서 해보고 싶어하시는 분들이, 기존에 같이 학습하며 호흡이 맞는 분들과 계속하게 되면서 자연스럽게 리서치 팀이 나오게 되었습니다.
우리 리서치 팀의 이름은 NLx Builders Crew입니다.
우리 리서치 팀은 이런 모양으로 구성되어 있습니다. 리서치 팀 디렉터(=대장)을 2대 리더 박수형님이 맡고 계시며, 그 안에 총 5개의 프로젝트가 진행중입니다. 현재 3년째 운영중인 역사와 전통이 그윽한 모임입니다.
- 이 개별 프로젝트를 이끄는 분들은 개별 스터디를 이끄는 것과 같은 일을 하는 리더고, 그 사람들을 빌더라고 부릅니다. (*이번 시즌에는 이 분들이 가짜연 프로그램에 정식으로 등록하지 않아서 정식 빌더가 아닙니다! 다음 시즌부터는 등록이 의무입니다).
- 빌더는 자신의 그룹을 조직하고 이끌며, 함께 오픈소스 프로젝트를 기획하고 빌드(Build) 하는 책임을 집니다.
- 이 프로젝트는 MIT, Apache 2.0 라이선스를 따르는 오픈소스로 개발되며, 깃허브(GitHub) 등의 플랫폼에 공개 저장소로 관리되는 것을 권장합니다.
- 예시로는 다음과 같은 오픈소스 프로젝트가 있습니다:
- LangChain 공식 문서 한국어 번역
- 오픈소스 프레임워크 개발
- 초급자를 위한 LLM 쿡북(Cookbook) 개발
- 허깅페이스(HuggingFace) 기반 챗봇 개발
- 예시로는 다음과 같은 오픈소스 프로젝트가 있습니다:
- 모든 프로젝트 리더들은 기본적으로 지식 기여를 합니다.
- 프로젝트는 따로 만들지 않으면서 개별적으로 지식 기여를 하시는 분들이 있습니다. 이분들 또한 지식 기여자들입니다.
- 참가자들이 각각 자신이 구상하는 프로젝트를 만들고,
- LLM 개발 분야의 새 소식을 모아 놓치는 일이 없게 하고,
- 그 지식을 총망라하는 인덱스(전과 같은)를 편찬 관리하는 것입니다.
- 이 모든 사람들이 모이는 수요일 스터디의 이름이 깃잔심입니다.
- 빌더는 필참, 일반 크루원은 참여가 권장됩니다.
- 각 그룹에서 정제한 llm 판의 새 소식을 공유하고, 각 프로젝트의 진행사항을 공유하면서 서로를 독려해줍니다.
- 자세한 운영방식은 [4. NBC운영 - 상세 소개](https://www.notion.so/4-NBC-208f199edf7c8051b874df1283ebfa6c?pvs=21) 를 읽어주세요.
우리가 공부한 내용을 정리해서 한 곳에 모읍니다.
AI/LLM 트렌드는 너무 빨리 바뀌고, 노이즈가 많다! 공동의 노력을 통해 새롭게 태어나는 것들을 체계적으로 정리해보는 프로젝트를 하고 있습니다. 이 프로젝트가 리서치 팀의 핵심, 존재이유입니다. 우리는 LLM에 대한 모든 굵직한 내용을 총망라하는 지식 베이스를 만들고 있고, 이걸 LLM Engineer’s Handbook 이라고 부릅니다.
우리가 매주 프로젝트/연구를 통해 학습하게 되는 내용을 모아서 이 지식 베이스에 업로드합니다. 그리고 시즌마다 새로 어떤 개념이 나왔는지 서베이한 후에 이 지식 베이스에 추가할 지점을 설정해 공부합니다.
이 지식 베이스를 관리하는 과정이 곧 참가자들이 학습하고 지식을 쌓는 일입니다. 동시에 집단적 수집과 리뷰를 통해 시행착오가 줄어들게 됩니다. 중요한 변화를 놓칠 일이 없습니다. 지식의 가치가 실시간으로 변동되는 만큼, 가장 최신의 지식이자 한번 가치가 리뷰된 지식들을 학습한다는 점은 큰 메리트입니다.
- LLM 개발 소식이 올라오는 곳에 데이터 수집 파이프라인을 달아, AI로 노이즈 필터링해서 핵심 소식을 모으는 코드를 운영하고 있습니다.
- 스터디 참가자들은 간단하게 이 내용의 가치를 평가하고, 가장 가치가 높은 뉴스만 짤막(1~5분 사이)하게 수요일 모임에 공유합니다.
- 시즌 전후로, 책의 목차를 회의해서 편찬합니다. 서베이 논문이나 출판된 서적을 살펴보면서 어떻게 개념들의 가치가 변했나 살펴봅니다. 중요성이 그 새 떨어진 (ex. 파인튜닝) 내용은 위치를 뒤로 하고, 새롭게 대두되는 개념들을 적절한 위치에 넣어보겠습니다.
- 독자들에 의해 추가적으로 정리되는 위키를 지향합니다 (자유롭게 PR할 수 있습니다)
- 이 책은 모든 내용이 주의깊게 쓰인 교과서 아닌, 레퍼런스 모음을 지향합니다. “이 주제는 왜 중요하고, 학습의 어느 시점에 알아야 하며, 어디를 살펴보면 이해할 수 있다” 는 것을 모아두는 겁니다.
- 다양한 스터디 그룹으로부터 기여를 받을 수록, 이 책은 실제 교과서에 가까워질 수 있을 겁니다. 각 스터디 그룹에서 학습한 발표자료들을 정리하여 여기에 실을 수 있습니다.
"모든 AI 실무자와 연구자들이 반드시 즐겨찾기하는 LLM 지식의 중심지가 된다!" 🚀📖
- 매주 '이주의 소식'을 정리 - 가장 영향력있는 변화를 캐치해 준다
- 신뢰할 수 있는 정보와 학습 자료를 찾을 수 있는 공간
- 최신 연구, 실무 사례, 기술 문서가 "전부" 체계적으로 정리되어 핸드북(Handbook) 형태로 제공하는 것
위, 가짜연구소 밖에 뭔가가 있는 걸 보실 수 있습니다. 일꾼 그룹입니다.
지식은 지수적으로 범람할 겁니다. 우리가 알아야 할 소식을 적절하게 줄여주는 AI 프로그램들이 더욱 필요해질 거고요. NBC가 LLM에 대한 내용을 압축 관리하는데 성공한다면, 다른 분야에서도 이런 요청이 있을 수 있습니다.
위키피디아 프로젝트의 정식 명칭은 ‘위키피디아 코몬스commons’ 입니다. 우리 프로젝트는 여기에서 이름을 따 왔습니다. 우리는 모두가 기여하고 모두가 쓸 수 있는 공유지가 되어주는 지식 베이스를 만들어내는 걸 목표로 합니다. 여기에 AI를 더해 ‘살아있는 지식’, 협력적 리뷰를 통해 발생과 학습 사이의 지연을 최소화하는 지식 베이스를 만들어내는 걸 목표로 합니다. 이 프로젝트를 우리는 Living Knowledge Commons(가칭) 라고 부릅니다. ****
Living Knowledge Commons 프로젝트를 를 위해, 재단을 만들려고 합니다. 아래 내용을 핸들링할 법적 주체가 필요하기 때문입니다.
- 핸드북의 운영을 위해 클라우드와 AI 크레딧을 지원받으려고 해요.
- 데이터 파이프라인이나 AI 요약기 등의 ‘인프라’ 개발 또한 누군가 계속 남아서 업그레이드 및 유지보수를 진행해 주어야 합니다. 우리의 기술력이 부족한 경우 외주가 필요할 때도 있을 겁니다.
- 일이 확장되는 경우 비영리사업 지원자금을 끌어올 수도 있는데, 이는 상당히 지루하고 회사 업무만큼 책임이 필요합니다. 만약 우리가 펀딩을 받게 되는 경우, 이걸 전담해서 처리해주시는 분들이 필요해지고, 그 분들께는 응분의 보상을 드려야 합니다.
우리는 그 **재단을 Living Knowledge Foundation (가칭)**이라고 부릅니다. 재단은 별개의 커뮤니티가 아닙니다. 개발 후원 운영 등 일꾼 모임입니다.
현재는 재단 인원과 NLX Crew 인원이 전부 겹치기 때문에, 큰 헷갈림은 없을 겁니다. 하지만 비전을 이뤄가는 과정에서, 문화가 전파되다 보면 달라질 겁니다
NLX Builders Crew는 LLM 개발과 관련된 모든 내용을 커버하는 핸드북, 그리고 그걸 공부하는 그룹을 운영하는 역할을 책임집니다. 재단은 데이터를 모으고 표현하는 인프라 및 운영 방식에 대한 지식 공유를 책임지는 역할을 합니다.
여기에 더해 이런 분들이 재단에 들어갑니다. 가짜연 내부의 다른 팀, 혹은 전혀 다른 모임에서 ‘우리도 이런걸 하고 싶다’고 신청하시면, 재단 사람들은 이런 분들에 대해 프로그램과 운영 방식의 초기 셋업을 지원해드리려고 해요. 그리고 새로운 주제를 담당하는 리더들이 재단의 멤버가 되어 자기 주제를 관리하는 일을 맡아주시겠죠.
문화가 퍼져나갈수록, 주제 별 개별적인 페이지가 생길 겁니다! 마치 '네이버 카페' 안에 '중고나라'나 '독취사', '맘스홀릭 베이비'가 있는 것 처럼, 인프라를 공유하지만 상이한 주제와 성격의 지식 베이스가 생겨날 거에요.
당장 LLM, NLP를 배우고 싶은 여러분께 Living Knowledge Commons 프로젝트는 조금 멀게 느껴질 겁니다. 우리는 이런 형태의 지식 관리가 미래라고 믿고, 이걸 처리해나가는 과정에 AI/LLM이 깊숙히 관여할 겁니다. 미래를 만들어내는 데 흥미가 있으신 분들과 함께하고 싶습니다. 연락주세요! 지원자 링크
모임이 많다 보니 헷갈리는 부분이 있습니다! 그림과 함께 상세히 설명하겠습니다.
함께해요! 지원자 링크
수요일은 리서치 팀 내 그룹들이 모두 모이는 자리입니다
- 매주, 그룹별로 찾은 지식을 짧게 공유하고, 중요성을 평가합니다. '지식 업데이트'
- 진행사항을 공유합니다. '성장을 위한 데드라인'
= 표면적인 정보가 아닌, 실제 구축 과정에서 얻은 통찰, 실패 사례와 노하우를 나누는 모임입니다
- SNS에 공유합니다. (개인 & 그룹 브랜딩과 홍보)
프로젝트 그룹의 리더들은 필참입니다. (빨간색) 러너들은 참여 권장, 외부 청강 환영입니다 (주황색)
수요일 모임과 별개로 각자 조별로 모입니다!
시간은 조별로 정해요
- 프로젝트를 만듭니다.
- 만들면서 새로 발견한 내용, 작성한 지식들을 리더가 모아둡시다. (도와주는 사람을 뽑아서 맡겨보자구여!)
- 홍보를 위해 업로드
- 지금은 한결이 나눠주지만, 앞으로는 그룹 리더들이 스스로 지식을 찾고 분배, 수합, 정제해야 함
why? 한 사람이 지식을 모으면, 사각이 생김 중복 허용하는 형태로 최대한 많은 지식을 커버해야 함
자동화, UI를 달아서 최대한 쉽게 만들어주면 가능하다!
프로젝트 안 하는 지식 기여자 분들은 그룹은, 지식 기여에만 집중합니다.
- 매주 할당받은 뉴스를 가이드라인에 맞는 양식대로 정리해 우리 노션 DB에 올립니다 (현재는 처음이라 할당해드리지만)
- 수요일날 발표합니다. 임팩트가 가장 높은 순서대로 다룹니다.
시간이 지날 수록, 스스로 새로운 소스를 찾아나가는 노력이 필요합니다.
처음으로 다 같이 만납니다! 인사 나누고 규칙, 기여 방식 등에 대해 최초로 전달합니다.
우리 리서치 팀도 시즌 중간점에 한번 모두가 모입니다. (이번에는 슈도콘 5/17이 됩니다)
- 팀별 프로젝트를 데모
리서치 팀 내 모든 사람이 참여합니다!
- 팀별 프로젝트를 데모
- 상반기 결산 & 회고
- 다음 시즌 진행 공지
이상입니다! 시스템이 다소 복잡하지만 꼭 숙지해주세요. 하다 보면 별로 어렵지 않습니다! 지원자 링크







