Mastodon discussion Apr 30

Brie Wensleydale (@SlipperyGem)Qwen Edit용 LoRA가 공유되며, 이미지 편집 및 생성 성능을 확장하는 경량 파인튜닝 솔루션으로 보인다. 오픈소스 기반 AI 모델 커스터마이징과 편집 워...

Brie Wensleydale (@SlipperyGem)Qwen Edit용 LoRA가 공유되며, 이미지 편집 및 생성 성능을 확장하는 경량 파인튜닝 솔루션으로 보인다. 오픈소스 기반 AI 모델 커스터마이징과 편집 워크플로우에 관심 있는 개발자에게 유용한 소식이다.https://x.com/SlipperyGem/status/...

Mastodon discussion Apr 29

Suresh (@_Suresh2)온디바이스 LoRA는 여전히 전체 베이스 모델을 로드해야 하며, 어댑터가 KV 캐시 크기도 줄여주지 않는다는 기술적 한계를 지적한다. 경량 추론과 메모리 최적화 측면에서 중요한 개발 ...

Suresh (@_Suresh2)온디바이스 LoRA는 여전히 전체 베이스 모델을 로드해야 하며, 어댑터가 KV 캐시 크기도 줄여주지 않는다는 기술적 한계를 지적한다. 경량 추론과 메모리 최적화 측면에서 중요한 개발 이슈다.https://x.com/_Suresh2/status/2049275115158815208#lora #...

Mastodon discussion Apr 23

vLLM, LoRA и GPU-кластеры: техническая анатомия обогащения поисковой выдачи Авито мультимодальными моделямиПривет, Хабр!...

vLLM, LoRA и GPU-кластеры: техническая анатомия обогащения поисковой выдачи Авито мультимодальными моделямиПривет, Хабр! Меня зовут Кирилл Нетреба , я Backend-ML-инженер в Авито . ...