cool datasets
updated
Viewer
•
Updated
•
10k
•
2.97k
•
524
rahulchakwate/squad-QG-dataset-original
Viewer
•
Updated
•
87.6k
•
26
•
2
Viewer
•
Updated
•
1k
•
53
•
10
Viewer
•
Updated
•
98.2k
•
101k
•
347
rahulchakwate/squad-QG-dataset-shuffled
Viewer
•
Updated
•
87.6k
•
15
Gautam9595/Squad_Translated
Viewer
•
Updated
•
115k
•
24
nreimers/reddit_question_best_answers
Viewer
•
Updated
•
1.83M
•
343
•
16
Preview
•
Updated
•
35
•
35
glaiveai/glaive-code-assistant
Viewer
•
Updated
•
136k
•
248
•
98
open-web-math/open-web-math
Viewer
•
Updated
•
6.32M
•
7.24k
•
324
Viewer
•
Updated
•
262k
•
4.16k
•
295
Viewer
•
Updated
•
183k
•
485
•
294
Nexusflow/NexusRaven_API_evaluation
Viewer
•
Updated
•
1.07k
•
556
•
17
alielfilali01/MAD-Main-Test
Viewer
•
Updated
•
67.1k
•
23
•
1
Viewer
•
Updated
•
211k
•
290
•
138
migtissera/Tess-Coder-v1.0
Viewer
•
Updated
•
117k
•
44
•
25
Preview
•
Updated
•
5.98k
•
5
Viewer
•
Updated
•
135k
•
1.68k
•
279
QuixiAI/Code-74k-ShareGPT-Vicuna
Viewer
•
Updated
•
73.9k
•
24
•
12
Viewer
•
Updated
•
109k
•
497
•
58
Viewer
•
Updated
•
2.75M
•
6.54k
•
380
Preview
•
Updated
•
46
•
50
Preview
•
Updated
•
277
•
193
wyzelabs/RuleRecommendation
Preview
•
Updated
•
17
•
18
Updated
•
10.9k
•
7
Viewer
•
Updated
•
1.31M
•
23
•
23
Updated
•
3.21k
•
6
Locutusque/UltraTextbooks
Viewer
•
Updated
•
5.52M
•
1.71k
•
196
Updated
•
1.61k
•
971
Viewer
•
Updated
•
206k
•
3.64k
•
331
Preview
•
Updated
•
28
•
49
Locutusque/function-calling-chatml
Viewer
•
Updated
•
113k
•
177
•
174
lilacai/glaive-function-calling-v2-sharegpt
Viewer
•
Updated
•
113k
•
106
•
29
Viewer
•
Updated
•
45.4k
•
39
•
13
unalignment/comedy-snippets-v0.1
Viewer
•
Updated
•
44
•
30
•
10
Viewer
•
Updated
•
186M
•
7.42k
•
35
Viewer
•
Updated
•
31.1M
•
45.4k
•
650
Viewer
•
Updated
•
5.45B
•
7.84k
•
438
Updated
•
115k
•
128
Viewer
•
Updated
•
7.02k
•
65
•
134
FreedomIntelligence/ALLaVA-4V
Viewer
•
Updated
•
143k
•
1.13k
•
91
Viewer
•
Updated
•
2M
•
56
•
5
Viewer
•
Updated
•
1.07k
•
126
•
26
Cohere/wikipedia-2023-11-embed-multilingual-v3
Viewer
•
Updated
•
247M
•
11.6k
•
239
Weyaxi/huggingface-spaces-codes
Viewer
•
Updated
•
19.9k
•
6.24k
•
11
Updated
•
5.17k
•
57
Viewer
•
Updated
•
16.3k
•
4.42k
•
94
Updated
•
384
•
1
Viewer
•
Updated
•
1.87k
•
24
•
1
Viewer
•
Updated
•
629
•
78
•
10
NousResearch/json-mode-eval
Viewer
•
Updated
•
100
•
482
•
40
NousResearch/func-calling-eval
Viewer
•
Updated
•
100
•
72
•
14
Updated
•
17.4k
•
347
Viewer
•
Updated
•
3.41M
•
4.76k
•
189
Viewer
•
Updated
•
101k
•
64
•
64
Viewer
•
Updated
•
7.1k
•
7.46k
•
155
Viewer
•
Updated
•
3.35M
•
953
•
22
HuggingFaceM4/the_cauldron
Viewer
•
Updated
•
1.88M
•
37.5k
•
511
Viewer
•
Updated
•
52.5B
•
187k
•
2.6k
gate369/alpaca-star-ascii
Viewer
•
Updated
•
387
•
24
•
5
Viewer
•
Updated
•
765
•
674
•
116
Viewer
•
Updated
•
2.49k
•
205
•
9
motherduckdb/duckdb-text2sql-25k
Viewer
•
Updated
•
25k
•
88
•
38
asgaardlab/CommonGameCorruptions
Viewer
•
Updated
•
7.19k
•
45
•
2
Viewer
•
Updated
•
8.01M
•
45.6k
•
478
chansung/merged_ds_coding
Viewer
•
Updated
•
60.6k
•
30
•
16
PleIAs/Post-OCR-Correction
Viewer
•
Updated
•
50.4k
•
2.04k
•
135
MemGPT/MemGPT-DPO-Dataset
Viewer
•
Updated
•
42.3k
•
91
•
10
nthakur/swim-ir-monolingual
Viewer
•
Updated
•
3.17M
•
317
•
10
nthakur/swim-ir-cross-lingual
Viewer
•
Updated
•
15.4M
•
383
•
9
Updated
•
162
•
14
Viewer
•
Updated
•
31.1k
•
2.28k
•
12
AILab-CVC/SEED-Bench-2-plus
Viewer
•
Updated
•
555
•
59
•
5
bigcode/self-oss-instruct-sc2-exec-filter-50k
Viewer
•
Updated
•
50.7k
•
265
•
104
Viewer
•
Updated
•
143k
•
935
•
15
masakhane/afriqa-gold-passages
Updated
•
156
•
5
masakhane/african-ultrachat
Viewer
•
Updated
•
55k
•
258
•
5
Viewer
•
Updated
•
153k
•
3.38k
•
12
Viewer
•
Updated
•
1.28B
•
2.38k
•
55
Updated
•
2.35k
•
371
NousResearch/CharacterCodex
Viewer
•
Updated
•
15.9k
•
168
•
226
Viewer
•
Updated
•
433k
•
217
•
46
allenai/SciRIFF-train-mix
Viewer
•
Updated
•
70.7k
•
29
•
9
PromptSystematicReview/ThePromptReport
Viewer
•
Updated
•
83
•
1.59k
•
45
louisbrulenaudet/legalkit
Viewer
•
Updated
•
53k
•
106
•
32
microsoft/MeetingBank-LLMCompressed
Viewer
•
Updated
•
5.17k
•
172
•
16
Viewer
•
Updated
•
17.3k
•
798
•
32
microsoft/MeetingBank-QA-Summary
Viewer
•
Updated
•
862
•
72
•
15
Magpie-Align/Magpie-Qwen2-Pro-1M-v0.1
Viewer
•
Updated
•
1M
•
119
•
14
Viewer
•
Updated
•
2.55M
•
12.9k
•
294
Viewer
•
Updated
•
486k
•
48
•
63
Viewer
•
Updated
•
1.75M
•
164
•
103
Viewer
•
Updated
•
6k
•
307
•
192
Viewer
•
Updated
•
119k
•
4.96k
•
88
CATMuS/medieval-segmentation
Viewer
•
Updated
•
1.68k
•
1.07k
•
6
antoinejeannot/jurisprudence
Viewer
•
Updated
•
2.12M
•
219
•
24
Viewer
•
Updated
•
39.5k
•
8.29k
•
341
HuggingFaceFW/fineweb-edu
Viewer
•
Updated
•
3.5B
•
317k
•
896
Viewer
•
Updated
•
6.91k
•
188
•
15
argilla/FinePersonas-v0.1
Viewer
•
Updated
•
42.1M
•
9.57k
•
408
lmms-lab/LLaVA-Video-178K
Viewer
•
Updated
•
1.63M
•
15.6k
•
184
Updated
•
51.2k
•
247
recursal/SuperWikiImage-7M
Updated
•
1.02k
•
19
Preview
•
Updated
•
191k
•
85
Viewer
•
Updated
•
826M
•
3.15k
•
61
Updated
•
384
•
86
louisbrulenaudet/lemone-docs-embedded
Viewer
•
Updated
•
16.1k
•
55
•
3
naijavoices/naijavoices-dataset
Viewer
•
Updated
•
1.92M
•
578
•
16
Viewer
•
Updated
•
12.4M
•
2.13k
•
170
Viewer
•
Updated
•
824
•
7.41k
•
238
ClovenDoug/150k_keyphrases_labelled
Viewer
•
Updated
•
2.26M
•
43
•
2
Cour-de-cassation/alpaca_ccass_motivations_sommaires_titres
Viewer
•
Updated
•
19.1k
•
78
•
3
microsoft/orca-agentinstruct-1M-v1
Viewer
•
Updated
•
1.05M
•
782
•
453
alpindale/two-million-bluesky-posts
Viewer
•
Updated
•
2.11M
•
555
•
200
Viewer
•
Updated
•
110M
•
1.56k
•
97
Viewer
•
Updated
•
286k
•
308
•
124
agibot-world/AgiBotWorld-Alpha
Viewer
•
Updated
•
49.8M
•
6.38k
•
208
DAMO-NLP-SG/multimodal_textbook
Updated
•
1.91k
•
156
Viewer
•
Updated
•
926k
•
2.41k
•
21
bytedance-research/ToolHop
Updated
•
599
•
18
Viewer
•
Updated
•
2.5k
•
20.4k
•
649
Viewer
•
Updated
•
182k
•
861
•
121
ServiceNow-AI/R1-Distill-SFT
Viewer
•
Updated
•
1.85M
•
2.04k
•
312
open-thoughts/OpenThoughts-114k
Viewer
•
Updated
•
228k
•
101k
•
784
tomg-group-umd/alpaca_cleaned_dataset_short
Viewer
•
Updated
•
32
•
5
•
1
Viewer
•
Updated
•
5.42M
•
929
•
4
MaziyarPanahi/M2Lingual-sharegpt
Viewer
•
Updated
•
174k
•
13
•
2
Viewer
•
Updated
•
4.59k
•
139
•
10
Viewer
•
Updated
•
307k
•
1.11k
•
2
OpenLLM-France/Lucie-Training-Dataset
Viewer
•
Updated
•
10.9B
•
8.3k
•
32
Viewer
•
Updated
•
2.19k
•
842
•
26
Josephgflowers/Finance-Instruct-500k
Viewer
•
Updated
•
518k
•
1.03k
•
201
facebook/natural_reasoning
Viewer
•
Updated
•
1.15M
•
1.37k
•
546
Updated
•
3.7k
•
58
Viewer
•
Updated
•
3.08M
•
1.81k
•
7
VanWang/Bespoke_dpo_filter
Viewer
•
Updated
•
10.1k
•
7
•
1
VanWang/Bespoke_dpo_filter_len_long
Viewer
•
Updated
•
1k
•
4
•
1
TheFinAI/Fino1_Reasoning_Path_FinQA
Viewer
•
Updated
•
5.5k
•
253
•
40
Preview
•
Updated
•
185
•
4
declare-lab/AlgoPuzzleVQA
Viewer
•
Updated
•
1.8k
•
116
•
9
Viewer
•
Updated
•
487k
•
2.44k
•
101
Viewer
•
Updated
•
205
•
1.58k
•
26
Viewer
•
Updated
•
160
•
399
•
4
Viewer
•
Updated
•
79.5M
•
520
•
22
Preview
•
Updated
•
733
•
13
Locutusque/Platinum-CoT-v0.1-ShareGPT
Viewer
•
Updated
•
2.42k
•
9
•
1
gretelai/gretel-safety-alignment-en-v1
Viewer
•
Updated
•
16.7k
•
511
•
16
Locutusque/deeplm-training-data
Viewer
•
Updated
•
2.17M
•
75
•
3
Viewer
•
Updated
•
1B
•
2.64k
•
30
hpcai-tech/open-sora-pexels-45k
Viewer
•
Updated
•
45.8k
•
4
winglian/codeforces-cot-16k-context
Viewer
•
Updated
•
24.3k
•
19
•
1
glaiveai/reasoning-v1-20m
Viewer
•
Updated
•
22.2M
•
3.03k
•
221
nvidia/Llama-Nemotron-Post-Training-Dataset
Viewer
•
Updated
•
3.91M
•
5.46k
•
639
nomic-ai/cornstack-python-v1
Viewer
•
Updated
•
23.6M
•
2.4k
•
21
Viewer
•
Updated
•
254k
•
2.93k
•
200
Viewer
•
Updated
•
753k
•
3.8k
•
519
Viewer
•
Updated
•
1.15k
•
531
•
90
Anthropic/values-in-the-wild
Viewer
•
Updated
•
6.91k
•
239
•
141
Viewer
•
Updated
•
1.98k
•
183
•
33
Viewer
•
Updated
•
7.5k
•
113
•
18
ZennyKenny/tactical-military-reasoning-v.1.0
Viewer
•
Updated
•
150
•
121
•
18
nvidia/Nemotron-CrossThink
Preview
•
Updated
•
209
•
112
Preview
•
Updated
•
6.05k
•
24
a-m-team/AM-DeepSeek-Distilled-40M
Viewer
•
Updated
•
11.5M
•
2.5k
•
51
Updated
•
77
•
5
open-r1/Mixture-of-Thoughts
Viewer
•
Updated
•
699k
•
3.67k
•
300
Preview
•
Updated
•
66k
•
511
Viewer
•
Updated
•
5.82M
•
412
•
61
Viewer
•
Updated
•
157M
•
3.62k
•
53
facebook/seamless-interaction
Updated
•
37.5k
•
165
MaziyarPanahi/smoltalk2-sft-no-think
Viewer
•
Updated
•
1.9M
•
81
•
5
facebook/community-alignment-dataset
Viewer
•
Updated
•
146k
•
419
•
38
interstellarninja/hermes_reasoning_tool_use
Viewer
•
Updated
•
51k
•
683
•
149
Viewer
•
Updated
•
1.25M
•
9.73k
•
120
MegaScience/TextbookReasoning
Viewer
•
Updated
•
652k
•
466
•
27
HuggingFaceH4/Multilingual-Thinking
Viewer
•
Updated
•
1k
•
11.8k
•
104
motionlabs/fineweb-ultra-mini
Viewer
•
Updated
•
131k
•
911
•
4
Viewer
•
Updated
•
168k
•
325
•
5
Updated
•
1.93k
•
42
Viewer
•
Updated
•
71.4k
•
195
•
8
OS-Copilot/OS-Genesis-web-data
Updated
•
36
•
8
Updated
•
683
•
26
Preview
•
Updated
•
1.7k
•
64
nvidia/Nemotron-Post-Training-Dataset-v2
Viewer
•
Updated
•
6.34M
•
7.54k
•
93
Text Generation
•
8B
•
Updated
•
208
•
61
continuedev/instinct-data
Viewer
•
Updated
•
9.04k
•
166
•
28
Viewer
•
Updated
•
476M
•
24.7k
•
691
Viewer
•
Updated
•
5.89M
•
4.98k
•
83
Preview
•
Updated
•
200
•
47
Viewer
•
Updated
•
6.35B
•
29.1k
•
77
smolagents/aguvis-stage-2
Viewer
•
Updated
•
784k
•
4.45k
•
25
nvidia/esm2_uniref_pretraining_data
Viewer
•
Updated
•
188M
•
2.16k
•
6
biglam/doab-metadata-extraction
Viewer
•
Updated
•
8.09k
•
265
•
12
rl-research/dr-tulu-rl-data
Viewer
•
Updated
•
4.88k
•
639
•
12
RUC-DataLab/DataScience-Instruct-500K
Viewer
•
Updated
•
26.2k
•
1.83k
•
69
openbmb/InfLLM-V2-data-5B
Viewer
•
Updated
•
7.19M
•
291
•
30
OpenMed/Medical-Reasoning-SFT-GPT-OSS-120B
Viewer
•
Updated
•
200k
•
3.85k
•
237
allenai/Dolci-Think-RL-7B-Completions-SFT
Viewer
•
Updated
•
636k
•
751
•
4
mahdi-ranjbar/math_search_strategy
Viewer
•
Updated
•
40
•
14
•
1
genrobot2025/10Kh-RealOmin-OpenData
Updated
•
38.6k
•
84