¿Qué es Papers with Code?
Papers with Code es una plataforma que destaca investigaciones de tendencia en el campo del aprendizaje automático junto con el código para implementarlas. Sirve como un recurso integral para investigadores y desarrolladores que buscan mantenerse actualizados con los últimos avances e implementaciones prácticas en aprendizaje automático.
Beneficios de Papers with Code
- Acceso a Investigaciones Recientes: Mantente al día con los artículos más recientes en aprendizaje automático.
- Implementación Lista: Acceso directo a implementaciones de código, facilitando la experimentación y el aprendizaje.
- Evaluación Comparativa: Compara el rendimiento de diferentes modelos en una variedad de tareas.
- Participación de la Comunidad: Involúcrate con una comunidad de investigadores y desarrolladores compartiendo ideas y mejoras.
Cómo Usar Papers with Code
- Explorar Artículos: Navega por una lista curada de artículos de aprendizaje automático ordenados por relevancia e impacto.
- Acceder al Código: Accede directamente a los repositorios que contienen las implementaciones de código de la investigación.
- Evaluar Modelos: Observa y compara el rendimiento de los modelos en conjuntos de datos y tareas estándar.
- Contribuir: Comparte mejoras o nuevas implementaciones con la comunidad.
Artículos Destacados
MossFormer: Pushing the Performance Limit of Monaural Speech Separation
- Descripción: Utiliza un transformador de una sola cabeza con autoatenciones conjuntas aumentadas por convolución para mejorar la separación del habla.
- Repositorio de Código: Disponible en GitHub bajo
modelscope/ClearerVoice-Studio
.
Gaze-LLE: Gaze Target Estimation via Large-Scale Learned Encoders
- Descripción: Se centra en predecir objetivos de mirada en una escena usando codificadores aprendidos.
- Repositorio de Código: Disponible en GitHub bajo
fkryan/gazelle
.
Segment Any Text: A Universal Approach for Sentence Segmentation
- Descripción: Introduce el modelo SaT para una segmentación de oraciones robusta y eficiente.
- Repositorio de Código: Disponible en GitHub bajo
facebookresearch/large_concept_model
.
StableAnimator: High-Quality Identity-Preserving Human Image Animation
- Descripción: Mejora la calidad del rostro durante la animación utilizando la optimización basada en la ecuación de Hamilton-Jacobi-Bellman.
- Repositorio de Código: Disponible en GitHub bajo
Francis-Rings/StableAnimator
.
SynCamMaster: Synchronizing Multi-Camera Video Generation
- Descripción: Avances en modelos de difusión de video para la generación consistente de video multicámara.
- Repositorio de Código: Disponible en GitHub bajo
kwaivgi/syncammaster
.
Learning Flow Fields in Attention for Controllable Person Image Generation
- Descripción: Mejora el rendimiento de los modelos de difusión utilizando una pérdida independiente del modelo.
- Repositorio de Código: Disponible en GitHub bajo
franciszzj/leffa
.
Neural Localizer Fields for Continuous 3D Human Pose and Shape Estimation
- Descripción: Transiciona el modelado 3D humano de una sola imagen a un paradigma centrado en los datos.
- Repositorio de Código: Disponible en GitHub bajo
isarandi/nlf
.
Video Seal: Open and Efficient Video Watermarking
- Descripción: Introduce un marco para la marca de agua de video neural.
- Repositorio de Código: Disponible en GitHub bajo
facebookresearch/videoseal
.
HunyuanVideo: A Systematic Framework For Large Video Generative Models
- Descripción: Un modelo de código abierto que demuestra alto rendimiento en la generación de video.
- Repositorio de Código: Disponible en GitHub bajo
tencent/hunyuanvideo
.
LLMs-as-Judges: A Comprehensive Survey on LLM-based Evaluation Methods
- Descripción: Analiza las limitaciones de los jueces LLM y las direcciones futuras.
- Repositorio de Código: Disponible en GitHub bajo
cshaitao/awesome-llms-as-judges
.