2 17 24

Zhen Dong

zhendongucb

https://dong-zhen.com/

AI & ML interests

None yet

Recent Activity

liked a dataset 17 days ago

nvidia/Nemotron-Math-Proofs-v1

liked a dataset 17 days ago

nvidia/Nemotron-CC-v2.1

upvoted a collection 17 days ago

Nemotron-Pre-Training-Datasets

View all activity

Organizations

liked 2 datasets 17 days ago

nvidia/Nemotron-Math-Proofs-v1

Viewer • Updated 17 days ago • 925k • 1.65k • 88

nvidia/Nemotron-CC-v2.1

Viewer • Updated 13 days ago • 3.8B • 35.2k • 96

upvoted a collection 17 days ago

Nemotron-Pre-Training-Datasets

Collection

Large scale pre-training datasets used in the Nemotron family of models. • 11 items • Updated 11 days ago • 87

liked a dataset 17 days ago

nvidia/Nemotron-Agentic-v1

Preview • Updated 20 days ago • 1.4k • 129

liked 2 models 17 days ago

nvidia/NVIDIA-Nemotron-3-Nano-30B-A3B-FP8

Text Generation • 32B • Updated 4 days ago • 529k • 217

nvidia/NVIDIA-Nemotron-3-Nano-30B-A3B-BF16

Text Generation • 32B • Updated 11 days ago • 261k • 519

liked 2 datasets 5 months ago

nvidia/Llama-Nemotron-VLM-Dataset-v1

Viewer • Updated Oct 22, 2025 • 2.86M • 2.22k • 155

nvidia/Llama-Nemotron-Post-Training-Dataset

Viewer • Updated May 8, 2025 • 3.91M • 5.46k • 630

liked a model 5 months ago

nvidia/Llama-3_3-Nemotron-Super-49B-v1_5-FP8

Text Generation • 50B • Updated Oct 15, 2025 • 1.1k • 23

upvoted 2 collections 5 months ago

NexusRaven V2

Collection

11 items • Updated Dec 14, 2023 • 3

Llama Nemotron

Collection

Open, Production-ready Enterprise Models • 12 items • Updated 11 days ago • 75

liked a model 5 months ago

nvidia/Llama-3_3-Nemotron-Super-49B-v1_5

Text Generation • 50B • Updated Oct 15, 2025 • 29.1k • 220

authored 3 papers 6 months ago

R-KV: Redundancy-aware KV Cache Compression for Reasoning Models

Paper • 2505.24133 • Published May 30, 2025 • 1

Efficient Deweather Mixture-of-Experts with Uncertainty-aware Feature-wise Linear Modulation

Paper • 2312.16610 • Published Dec 27, 2023

CVPR 2023 Text Guided Video Editing Competition

Paper • 2310.16003 • Published Oct 24, 2023

upvoted 3 papers 6 months ago

NoisyQuant: Noisy Bias-Enhanced Post-Training Activation Quantization for Vision Transformers

Paper • 2211.16056 • Published Nov 29, 2022 • 4

PB-LLM: Partially Binarized Large Language Models

Paper • 2310.00034 • Published Sep 29, 2023 • 2

R-KV: Redundancy-aware KV Cache Compression for Reasoning Models

Paper • 2505.24133 • Published May 30, 2025 • 1

authored a paper 6 months ago

DrafterBench: Benchmarking Large Language Models for Tasks Automation in Civil Engineering

Paper • 2507.11527 • Published Jul 15, 2025 • 32

upvoted a paper 6 months ago

DrafterBench: Benchmarking Large Language Models for Tasks Automation in Civil Engineering

Paper • 2507.11527 • Published Jul 15, 2025 • 32

Zhen Dong

AI & ML interests

Recent Activity

Organizations

zhendongucb's activity