1 19 7

Avishai Elmakies

avishai-elmakies

AI & ML interests

None yet

Recent Activity

upvoted a paper 14 days ago

Follow the Flow: On Information Flow Across Textual Tokens in Text-to-Image Models

upvoted a paper 17 days ago

Scaling Analysis of Interleaved Speech-Text Language Models

commented on a paper 19 days ago

Open-Qwen2VL: Compute-Efficient Pre-Training of Fully-Open Multimodal LLMs on Academic Resources

View all activity

Organizations

avishai-elmakies's activity

upvoted a paper 14 days ago

Follow the Flow: On Information Flow Across Textual Tokens in Text-to-Image Models

Paper • 2504.01137 • Published 20 days ago • 20

upvoted a paper 17 days ago

Scaling Analysis of Interleaved Speech-Text Language Models

Paper • 2504.02398 • Published 18 days ago • 27

upvoted a paper 19 days ago

Open-Qwen2VL: Compute-Efficient Pre-Training of Fully-Open Multimodal LLMs on Academic Resources

Paper • 2504.00595 • Published 20 days ago • 34

upvoted a paper 20 days ago

Open-Reasoner-Zero: An Open Source Approach to Scaling Up Reinforcement Learning on the Base Model

Paper • 2503.24290 • Published 21 days ago • 61

upvoted a paper 28 days ago

Single Image Iterative Subject-driven Generation and Editing

Paper • 2503.16025 • Published Mar 20 • 14

upvoted 4 papers about 1 month ago

upvoted a collection about 2 months ago

Slam

Collection

All resources for SpeechLMs from "Slamming: Training a Speech Language Model on One GPU in a Day". We provide tokeniser, lm, and datasets • 6 items • Updated Feb 25 • 13

upvoted a paper about 2 months ago

Slamming: Training a Speech Language Model on One GPU in a Day

Paper • 2502.15814 • Published Feb 19 • 69

upvoted 2 papers 2 months ago

Can this Model Also Recognize Dogs? Zero-Shot Model Search from Weights

Paper • 2502.09619 • Published Feb 13 • 34

Distillation Scaling Laws

Paper • 2502.08606 • Published Feb 12 • 48

upvoted 3 papers 3 months ago

Optimizing Large Language Model Training Using FP4 Quantization

Paper • 2501.17116 • Published Jan 28 • 38

Unsupervised Speech Segmentation: A General Approach Using Speech Language Models

Paper • 2501.03711 • Published Jan 7 • 1

Through-The-Mask: Mask-based Motion Trajectories for Image-to-Video Generation

Paper • 2501.03059 • Published Jan 6 • 22

upvoted a paper 6 months ago

Continuous Speech Synthesis using per-token Latent Diffusion

Paper • 2410.16048 • Published Oct 21, 2024 • 30

upvoted 2 papers 7 months ago

Reward-Robust RLHF in LLMs

Paper • 2409.15360 • Published Sep 18, 2024 • 6

A Suite for Acoustic Language Model Evaluation

Paper • 2409.07437 • Published Sep 11, 2024 • 7