Papers with Code 是什麼?
Papers with Code 是一個平台,專注於展示機器學習領域的熱門研究及其實施代碼。它為研究人員和開發者提供了一個全面的資源,幫助他們了解機器學習的最新進展和實際應用。
Papers with Code 的好處
- 獲取最新研究:隨時了解機器學習領域的最新論文。
- 隨時實施:直接獲取代碼實現,方便實驗和學習。
- 基準測試:比較不同模型在各種任務上的性能。
- 社群互動:與研究人員和開發者社群交流,分享見解和改進。
如何使用 Papers with Code
- 探索論文:瀏覽按相關性和影響力排序的機器學習論文精選列表。
- 獲取代碼:直接訪問包含研究代碼實現的倉庫。
- 基準測試模型:查看和比較模型在標準數據集和任務上的性能。
- 貢獻:與社群分享改進或新的實現。
精選論文
MossFormer: Pushing the Performance Limit of Monaural Speech Separation
- 描述:利用帶有卷積增強的聯合自注意力的門控單頭變壓器來改善語音分離。
- 代碼倉庫:可在 GitHub 上的
modelscope/ClearerVoice-Studio
找到。
Gaze-LLE: Gaze Target Estimation via Large-Scale Learned Encoders
- 描述:專注於使用學習編碼器預測場景中的注視目標。
- 代碼倉庫:可在 GitHub 上的
fkryan/gazelle
找到。
Segment Any Text: A Universal Approach for Sentence Segmentation
- 描述:引入 SaT 模型以實現穩健且高效的句子分割。
- 代碼倉庫:可在 GitHub 上的
facebookresearch/large_concept_model
找到。
StableAnimator: High-Quality Identity-Preserving Human Image Animation
- 描述:使用基於 Hamilton-Jacobi-Bellman 方程的優化來提升動畫中的面部質量。
- 代碼倉庫:可在 GitHub 上的
Francis-Rings/StableAnimator
找到。
SynCamMaster: Synchronizing Multi-Camera Video Generation
- 描述:在視頻擴散模型中取得進展,以實現一致的多攝像機視頻生成。
- 代碼倉庫:可在 GitHub 上的
kwaivgi/syncammaster
找到。
Learning Flow Fields in Attention for Controllable Person Image Generation
- 描述:使用模型無關的損失來提升擴散模型的性能。
- 代碼倉庫:可在 GitHub 上的
franciszzj/leffa
找到。
Neural Localizer Fields for Continuous 3D Human Pose and Shape Estimation
- 描述:將單影像3D人類建模轉變為數據中心化範式。
- 代碼倉庫:可在 GitHub 上的
isarandi/nlf
找到。
Video Seal: Open and Efficient Video Watermarking
- 描述:引入一個神經視頻水印框架。
- 代碼倉庫:可在 GitHub 上的
facebookresearch/videoseal
找到。
HunyuanVideo: A Systematic Framework For Large Video Generative Models
- 描述:一個開源模型,展示了視頻生成中的高性能。
- 代碼倉庫:可在 GitHub 上的
tencent/hunyuanvideo
找到。
LLMs-as-Judges: A Comprehensive Survey on LLM-based Evaluation Methods
- 描述:分析 LLM 判斷的限制和未來方向。
- 代碼倉庫:可在 GitHub 上的
cshaitao/awesome-llms-as-judges
找到。