Texto y Escritura-Documentos

¿Qué es Papers with Code?

Papers with Code es una plataforma que destaca investigaciones de tendencia en el campo del aprendizaje automático junto con el código para implementarlas. Sirve como un recurso integral para investigadores y desarrolladores que buscan mantenerse actualizados con los últimos avances e implementaciones prácticas en aprendizaje automático.

Beneficios de Papers with Code

Acceso a Investigaciones Recientes: Mantente al día con los artículos más recientes en aprendizaje automático.
Implementación Lista: Acceso directo a implementaciones de código, facilitando la experimentación y el aprendizaje.
Evaluación Comparativa: Compara el rendimiento de diferentes modelos en una variedad de tareas.
Participación de la Comunidad: Involúcrate con una comunidad de investigadores y desarrolladores compartiendo ideas y mejoras.

Cómo Usar Papers with Code

Explorar Artículos: Navega por una lista curada de artículos de aprendizaje automático ordenados por relevancia e impacto.
Acceder al Código: Accede directamente a los repositorios que contienen las implementaciones de código de la investigación.
Evaluar Modelos: Observa y compara el rendimiento de los modelos en conjuntos de datos y tareas estándar.
Contribuir: Comparte mejoras o nuevas implementaciones con la comunidad.

Artículos Destacados

MossFormer: Pushing the Performance Limit of Monaural Speech Separation

Descripción: Utiliza un transformador de una sola cabeza con autoatenciones conjuntas aumentadas por convolución para mejorar la separación del habla.
Repositorio de Código: Disponible en GitHub bajo modelscope/ClearerVoice-Studio.

Gaze-LLE: Gaze Target Estimation via Large-Scale Learned Encoders

Descripción: Se centra en predecir objetivos de mirada en una escena usando codificadores aprendidos.
Repositorio de Código: Disponible en GitHub bajo fkryan/gazelle.

Segment Any Text: A Universal Approach for Sentence Segmentation

Descripción: Introduce el modelo SaT para una segmentación de oraciones robusta y eficiente.
Repositorio de Código: Disponible en GitHub bajo facebookresearch/large_concept_model.

StableAnimator: High-Quality Identity-Preserving Human Image Animation

Descripción: Mejora la calidad del rostro durante la animación utilizando la optimización basada en la ecuación de Hamilton-Jacobi-Bellman.
Repositorio de Código: Disponible en GitHub bajo Francis-Rings/StableAnimator.

SynCamMaster: Synchronizing Multi-Camera Video Generation

Descripción: Avances en modelos de difusión de video para la generación consistente de video multicámara.
Repositorio de Código: Disponible en GitHub bajo kwaivgi/syncammaster.

Learning Flow Fields in Attention for Controllable Person Image Generation

Descripción: Mejora el rendimiento de los modelos de difusión utilizando una pérdida independiente del modelo.
Repositorio de Código: Disponible en GitHub bajo franciszzj/leffa.

Neural Localizer Fields for Continuous 3D Human Pose and Shape Estimation

Descripción: Transiciona el modelado 3D humano de una sola imagen a un paradigma centrado en los datos.
Repositorio de Código: Disponible en GitHub bajo isarandi/nlf.

Video Seal: Open and Efficient Video Watermarking

Descripción: Introduce un marco para la marca de agua de video neural.
Repositorio de Código: Disponible en GitHub bajo facebookresearch/videoseal.

HunyuanVideo: A Systematic Framework For Large Video Generative Models

Descripción: Un modelo de código abierto que demuestra alto rendimiento en la generación de video.
Repositorio de Código: Disponible en GitHub bajo tencent/hunyuanvideo.

LLMs-as-Judges: A Comprehensive Survey on LLM-based Evaluation Methods

Descripción: Analiza las limitaciones de los jueces LLM y las direcciones futuras.
Repositorio de Código: Disponible en GitHub bajo cshaitao/awesome-llms-as-judges.