2026년 1월 - 멤버십 나란 스터디 - CUDA/GPU 프로그래밍 - 중급반

입문반 과정을 마치시거나 CUDA GPU 프로그래밍에 경험이 있는 분들을 대상으로 조금 심도있는 CUDA와 GPU 병렬 프로그래밍을 함께 공부하는 스터디 그룹을 시작합니다. 이번 중급반에서는 Udemy의 Mastering GPU Parallel Programming with CUDA: (HW & SW) 과목을 함께 공부합니다. 코스제목: Mastering GPU Parallel Programming with CUDA: ( HW & SW )
기간: 2026년 1월 10일 ~ 2026년 3월 29일 (8주간)
일정
사전모임: 2026년 1월 10일 - 슬랙 공지
마무리모임: 2026년 3월 29일 미국 동부시각 오후 8시
중간모임: 미국 동부시간 매주 토요일 오후 8-10시 (한국 시각 일요일 오전 10~12시)
강의자료
Udemy 강의: Mastering GPU Parallel Programming with CUDA: ( HW & SW )
쿠폰정보: CP250105G1 ($9.99에 구매가 가능합니다)
학습 목표
GPU 아키텍쳐, 최신 GPU 이해
CUDA 프로그래밍 이해
Nsight를 이용한 프로파일링 기법 습득
프로파일러를 이용한 디버깅과 퍼포먼서 향상
매트릭스 연산
PyTorch Model, LLM, VLLM, Dynamo 등 AI model 관련 리서치
커리큘럼
1주차 — GPU 개요, 환경설정 (2026-01-17)
핵심: GPU 기본 구조/개념 이해 + 실습 가능한 개발 환경 셋업
결과: 이후 CUDA/프로파일링 실습을 바로 시작할 수 있는 준비 완료
리서치: 최신 GPU 업데이트
2주차 — CUDA 개요 (2026-01-24)
핵심: CUDA 기본 모델(커널 실행/메모리/스레드 구조) 이해
결과: 간단한 CUDA 코드 흐름을 읽고 실행 단위를 이해
리서치: 최신 CUDA 업데이트, AI Infra Overview
3주차 — 프로파일링 (2026-01-31)
핵심: 병목 찾는 방법(프로파일링) + 지표 해석 기반 성능 진단
결과: “느린 이유”를 데이터로 설명하고 개선 포인트를 뽑아낼 수 있음
4주차 — 퍼포먼스 (2026-02-07)
핵심: 성능 최적화 접근법(메모리/병렬성/실행 구조 관점)
결과: GPU 구조(block/thread/memory) 관점으로 최적화 아이디어 설계 가능
리서치: 최신 퍼포먼스 향상 기법, 최신 GPU block/thread/memory 구조
5주차 — 디버깅, 퍼포먼스 향상 (2026-02-21)
핵심: CUDA/GPU 코드 디버깅 흐름 + 단계적 최적화 적용
결과: 오류를 빠르게 재현/수정하고, 개선을 반복 적용하는 루틴 확보
6주차 — 퍼포먼스 향상, 루프라인 (2026-02-28)
핵심: 최적화 심화 + 파이프라인 관점으로 성능/처리량 개선
결과: 모델/워크로드를 “분석→개선→검증”으로 돌리는 실전형 프로세스 강화
리서치: PyTorch 모델 성능 분석 기법, LLM
7주차 — 매트릭스 연산 (2026-03-07)
핵심: GPU에서 가장 중요한 연산(매트릭스/GEMM 계열) 이해
결과: 딥러닝 성능 핵심 연산이 왜/어떻게 빠르게 동작하는지 설명 가능
8주차 — 마무리 (2026-03-14)
핵심: GPU 프로그래밍의 미래/트렌드 정리 + 최신 런타임/서빙 스택 이해
결과: Dynamo, vLLM, inference engine 등으로 이어지는 확장 로드맵 확보
리서치: Future of GPU programming, Quantum computing, Dynamo & inference engine, vLLM
참가대상: CUDA/GPU에 대한 기본 지식이 필요합니다.
운영방식: 각자 강의 청취, 코딩실습, Slack 토론 리뷰세션 발표
특이사항: $50의 멤버십 비용은 모임을 끝까지 잘 마무리하셔서 수료하시면 반환해드립니다.
정원: XX명
운영자: @바람
얼마나 많은 시간이 필요한가요?
강의 청취나 책을 읽는데 32시간 정도가 필요합니다.
실습에 16시간 정도가 필요합니다.
리뷰모임에 대략 16시간 정도가 필요합니다.
총 74시간 정도의 시간 투자가 필요하며, 크레딧(베타 테스트 중)은 7점입니다.