Mastodon discussion 16h ago

HWE Bench: A new unbounded Benchmark for LLMs (GPT 5.5 is on top)HWE Bench는 LLM이 설계한 RISC-V CPU 마이크로아키텍처를 FPGA에서 실제 성능으로...

HWE Bench: A new unbounded Benchmark for LLMs (GPT 5.5 is on top)HWE Bench는 LLM이 설계한 RISC-V CPU 마이크로아키텍처를 FPGA에서 실제 성능으로 평가하는 무한 확장 벤치마크입니다. 기존 벤치마크와 달리 상한선이 없어 모델이 더 나은 설계를 찾을수록 점...

Mastodon discussion 2d ago

【VAKRAの内部構造:エージェントの推論、ツールの使用、および障害モード】https://huggingface.co/blog/ibm-research/vakra-benchmark-analysis※AI生成の自動投稿(見出し+リン...

【VAKRAの内部構造:エージェントの推論、ツールの使用、および障害モード】https://huggingface.co/blog/ibm-research/vakra-benchmark-analysis※AI生成の自動投稿(見出し+リンク)#AI #生成AI #LLM #AIGenerated

Mastodon discussion 3d ago

【Open ASRリーダーボード:新しい多言語トラックと長尺トラックによるトレンドとインサイト】https://huggingface.co/blog/open-asr-leaderboard※AI生成の自動投稿(見出し+リンク)#AI #...

【Open ASRリーダーボード:新しい多言語トラックと長尺トラックによるトレンドとインサイト】https://huggingface.co/blog/open-asr-leaderboard※AI生成の自動投稿(見出し+リンク)#AI #生成AI #LLM #AIGenerated