Texto e Escrita-Documentos

O que é o Papers with Code?

Papers with Code é uma plataforma que destaca pesquisas em destaque no campo de aprendizado de máquina, juntamente com o código para implementá-las. Serve como um recurso abrangente para pesquisadores e desenvolvedores que desejam se manter atualizados com os avanços mais recentes e implementações práticas em aprendizado de máquina.

Benefícios do Papers with Code

Acesso à Pesquisa Mais Recente: Mantenha-se atualizado com os artigos mais recentes em aprendizado de máquina.
Pronto para Implementação: Acesso direto a implementações de código, facilitando a experimentação e o aprendizado.
Benchmarking: Compare o desempenho de diferentes modelos em uma variedade de tarefas.
Engajamento da Comunidade: Interaja com uma comunidade de pesquisadores e desenvolvedores compartilhando insights e melhorias.

Como Usar o Papers with Code

Explorar Artigos: Navegue por uma lista curada de artigos de aprendizado de máquina classificados por relevância e impacto.
Acessar Código: Acesse diretamente repositórios contendo as implementações de código da pesquisa.
Benchmark de Modelos: Veja e compare desempenhos de modelos em conjuntos de dados e tarefas padrão.
Contribuir: Compartilhe melhorias ou novas implementações com a comunidade.

Artigos em Destaque

MossFormer: Pushing the Performance Limit of Monaural Speech Separation

Descrição: Utiliza um transformer de cabeça única com auto-atenções conjuntas aumentadas por convolução para melhorar a separação de fala.
Repositório de Código: Disponível no GitHub em modelscope/ClearerVoice-Studio.

Gaze-LLE: Gaze Target Estimation via Large-Scale Learned Encoders

Descrição: Foca em prever alvos de olhar em uma cena usando codificadores aprendidos.
Repositório de Código: Disponível no GitHub em fkryan/gazelle.

Segment Any Text: A Universal Approach for Sentence Segmentation

Descrição: Introduz o modelo SaT para segmentação de sentenças robusta e eficiente.
Repositório de Código: Disponível no GitHub em facebookresearch/large_concept_model.

StableAnimator: High-Quality Identity-Preserving Human Image Animation

Descrição: Melhora a qualidade do rosto durante a animação usando otimização baseada na equação de Hamilton-Jacobi-Bellman.
Repositório de Código: Disponível no GitHub em Francis-Rings/StableAnimator.

SynCamMaster: Synchronizing Multi-Camera Video Generation

Descrição: Avanços em modelos de difusão de vídeo para geração consistente de vídeo com várias câmeras.
Repositório de Código: Disponível no GitHub em kwaivgi/syncammaster.

Learning Flow Fields in Attention for Controllable Person Image Generation

Descrição: Melhora o desempenho de modelos de difusão usando uma perda independente de modelo.
Repositório de Código: Disponível no GitHub em franciszzj/leffa.

Neural Localizer Fields for Continuous 3D Human Pose and Shape Estimation

Descrição: Transiciona o modelamento 3D humano de uma única imagem para um paradigma centrado em dados.
Repositório de Código: Disponível no GitHub em isarandi/nlf.

Video Seal: Open and Efficient Video Watermarking

Descrição: Introduz uma estrutura para marca d'água neural em vídeo.
Repositório de Código: Disponível no GitHub em facebookresearch/videoseal.

HunyuanVideo: A Systematic Framework For Large Video Generative Models

Descrição: Um modelo de código aberto que demonstra alto desempenho na geração de vídeos.
Repositório de Código: Disponível no GitHub em tencent/hunyuanvideo.

LLMs-as-Judges: A Comprehensive Survey on LLM-based Evaluation Methods

Descrição: Analisa limitações dos juízes LLM e direções futuras.
Repositório de Código: Disponível no GitHub em cshaitao/awesome-llms-as-judges.