O que é o Papers with Code?
Papers with Code é uma plataforma que destaca pesquisas em destaque no campo de aprendizado de máquina, juntamente com o código para implementá-las. Serve como um recurso abrangente para pesquisadores e desenvolvedores que desejam se manter atualizados com os avanços mais recentes e implementações práticas em aprendizado de máquina.
Benefícios do Papers with Code
- Acesso à Pesquisa Mais Recente: Mantenha-se atualizado com os artigos mais recentes em aprendizado de máquina.
- Pronto para Implementação: Acesso direto a implementações de código, facilitando a experimentação e o aprendizado.
- Benchmarking: Compare o desempenho de diferentes modelos em uma variedade de tarefas.
- Engajamento da Comunidade: Interaja com uma comunidade de pesquisadores e desenvolvedores compartilhando insights e melhorias.
Como Usar o Papers with Code
- Explorar Artigos: Navegue por uma lista curada de artigos de aprendizado de máquina classificados por relevância e impacto.
- Acessar Código: Acesse diretamente repositórios contendo as implementações de código da pesquisa.
- Benchmark de Modelos: Veja e compare desempenhos de modelos em conjuntos de dados e tarefas padrão.
- Contribuir: Compartilhe melhorias ou novas implementações com a comunidade.
Artigos em Destaque
MossFormer: Pushing the Performance Limit of Monaural Speech Separation
- Descrição: Utiliza um transformer de cabeça única com auto-atenções conjuntas aumentadas por convolução para melhorar a separação de fala.
- Repositório de Código: Disponível no GitHub em
modelscope/ClearerVoice-Studio
.
Gaze-LLE: Gaze Target Estimation via Large-Scale Learned Encoders
- Descrição: Foca em prever alvos de olhar em uma cena usando codificadores aprendidos.
- Repositório de Código: Disponível no GitHub em
fkryan/gazelle
.
Segment Any Text: A Universal Approach for Sentence Segmentation
- Descrição: Introduz o modelo SaT para segmentação de sentenças robusta e eficiente.
- Repositório de Código: Disponível no GitHub em
facebookresearch/large_concept_model
.
StableAnimator: High-Quality Identity-Preserving Human Image Animation
- Descrição: Melhora a qualidade do rosto durante a animação usando otimização baseada na equação de Hamilton-Jacobi-Bellman.
- Repositório de Código: Disponível no GitHub em
Francis-Rings/StableAnimator
.
SynCamMaster: Synchronizing Multi-Camera Video Generation
- Descrição: Avanços em modelos de difusão de vídeo para geração consistente de vídeo com várias câmeras.
- Repositório de Código: Disponível no GitHub em
kwaivgi/syncammaster
.
Learning Flow Fields in Attention for Controllable Person Image Generation
- Descrição: Melhora o desempenho de modelos de difusão usando uma perda independente de modelo.
- Repositório de Código: Disponível no GitHub em
franciszzj/leffa
.
Neural Localizer Fields for Continuous 3D Human Pose and Shape Estimation
- Descrição: Transiciona o modelamento 3D humano de uma única imagem para um paradigma centrado em dados.
- Repositório de Código: Disponível no GitHub em
isarandi/nlf
.
Video Seal: Open and Efficient Video Watermarking
- Descrição: Introduz uma estrutura para marca d'água neural em vídeo.
- Repositório de Código: Disponível no GitHub em
facebookresearch/videoseal
.
HunyuanVideo: A Systematic Framework For Large Video Generative Models
- Descrição: Um modelo de código aberto que demonstra alto desempenho na geração de vídeos.
- Repositório de Código: Disponível no GitHub em
tencent/hunyuanvideo
.
LLMs-as-Judges: A Comprehensive Survey on LLM-based Evaluation Methods
- Descrição: Analisa limitações dos juízes LLM e direções futuras.
- Repositório de Código: Disponível no GitHub em
cshaitao/awesome-llms-as-judges
.