Pang Wei Koh's picture

3 5 1

Pang Wei Koh

pangwei

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 6 days ago

DataDecide: How to Predict Best Pretraining Data with Small Experiments

authored a paper 12 days ago

OLMoTrace: Tracing Language Model Outputs Back to Trillions of Training Tokens

upvoted a paper 13 days ago

OLMoTrace: Tracing Language Model Outputs Back to Trillions of Training Tokens

View all activity

Organizations

None yet

pangwei's activity

upvoted a paper 6 days ago

DataDecide: How to Predict Best Pretraining Data with Small Experiments

Paper • 2504.11393 • Published 7 days ago • 15

upvoted a paper 13 days ago

OLMoTrace: Tracing Language Model Outputs Back to Trillions of Training Tokens

Paper • 2504.07096 • Published 13 days ago • 73

upvoted 2 papers 5 months ago

Negative Token Merging: Image-based Adversarial Feature Guidance

Paper • 2412.01339 • Published Dec 2, 2024 • 23

OpenScholar: Synthesizing Scientific Literature with Retrieval-augmented LMs

Paper • 2411.14199 • Published Nov 21, 2024 • 32

upvoted a paper 9 months ago

Scaling Retrieval-Based Language Models with a Trillion-Token Datastore

Paper • 2407.12854 • Published Jul 9, 2024 • 32