2 45 20

Junjie Chen

coderchen01

https://junjie-chen.info

AI & ML interests

Efficient AI, Multimodal AI, Generative AI

Recent Activity

upvoted a paper about 17 hours ago

CLASH: Evaluating Language Models on Judging High-Stakes Dilemmas from Multiple Perspectives

liked a model 9 days ago

Qwen/Qwen2.5-Omni-7B

upvoted a paper 22 days ago

TextCrafter: Accurately Rendering Multiple Texts in Complex Visual Scenes

View all activity

Organizations

None yet

coderchen01's activity

upvoted a paper about 17 hours ago

CLASH: Evaluating Language Models on Judging High-Stakes Dilemmas from Multiple Perspectives

Paper • 2504.10823 • Published 8 days ago • 14

upvoted a paper 22 days ago

TextCrafter: Accurately Rendering Multiple Texts in Complex Visual Scenes

Paper • 2503.23461 • Published 23 days ago • 94

upvoted 4 papers about 1 month ago

Block Diffusion: Interpolating Between Autoregressive and Diffusion Language Models

Paper • 2503.09573 • Published Mar 12 • 70

upvoted an article about 2 months ago

Article

The Annotated Diffusion Model

Jun 7, 2022

• 193

upvoted 3 papers about 2 months ago

Multimodal Representation Alignment for Image Generation: Text-Image Interleaved Control Is Easier Than You Think

Paper • 2502.20172 • Published Feb 27 • 28

FlexiDiT: Your Diffusion Transformer Can Easily Generate High-Quality Samples with Less Compute

Paper • 2502.20126 • Published Feb 27 • 20

UniTok: A Unified Tokenizer for Visual Generation and Understanding

Paper • 2502.20321 • Published Feb 27 • 30

upvoted 2 articles about 2 months ago

Article

Mixture of Experts Explained

Dec 11, 2023

• 568

Article

Illustrating Reinforcement Learning from Human Feedback (RLHF)

Dec 9, 2022

• 235

upvoted a paper 4 months ago

Smarter, Better, Faster, Longer: A Modern Bidirectional Encoder for Fast, Memory Efficient, and Long Context Finetuning and Inference

Paper • 2412.13663 • Published Dec 18, 2024 • 148

upvoted 4 papers 5 months ago

PaliGemma 2: A Family of Versatile VLMs for Transfer

Paper • 2412.03555 • Published Dec 4, 2024 • 135

RedPajama: an Open Dataset for Training Large Language Models

Paper • 2411.12372 • Published Nov 19, 2024 • 56

SlimLM: An Efficient Small Language Model for On-Device Document Assistance

Paper • 2411.09944 • Published Nov 15, 2024 • 12

Top-nσ: Not All Logits Are You Need

Paper • 2411.07641 • Published Nov 12, 2024 • 22

upvoted a paper 6 months ago

"Give Me BF16 or Give Me Death"? Accuracy-Performance Trade-Offs in LLM Quantization

Paper • 2411.02355 • Published Nov 4, 2024 • 51