ChainCatcher 메시지, DeepSeek 오늘 "오픈 소스 주간"을 시작하며, 첫 번째 오픈 소스 코드 라이브러리는 Flash MLA------Hopper GPU 최적화를 위한 효율적인 MLA 디코딩 커널로, 가변 길이 시퀀스를 처리하도록 설계되었습니다.
소개에 따르면, Flash MLA는 FlashAttention 2\&3 및 cutlass 프로젝트에서 영감을 받았습니다.