Discover AI datasets
across platforms

Recure helps machine learning teams discover and evaluate datasets across sources with AI-powered search and standardized metadata.

AI-Powered Aggregation

Our agent continuously scans connected sources, surfacing new and updated datasets automatically.

1Search Once

dataset for self-driving

NLM

Cityscapes Semantic

BDD100K Driving

KITTI Segmentation

Describe what you need in plain language and our semantic engine handles the rest.

2AI-Enriched Metadata

Cityscapes Semantic

25,000 images · 50 cities

High-quality pixel level annotations for street scenes.

segmentation

autonomous-driving

urban

pixel-level

● 42

50.0k

1000

Each dataset is standardized with tags, summaries, task and modality classification, and a directional health score.

3Compare & Decide

Cityscapes

Images25K

Classes30

Score92

LicenseCC-BY

Downloads50K

Rating4.8

BDD100K

Images100K

Classes40

Score87

LicenseBSD-3

Downloads1M

Rating4.8/5

Compare datasets on classes, modalities, license, file types, and quality signals in one unified view.

Trending Now

Browse by Category

Explore datasets organized by domain and use case

Recently Added

Newly discovered datasets from the past week

View All

Featured Datasets

Handpicked high-quality datasets from across the web

View All

Benchmark Datasets

Standard datasets with publicly available baseline metrics and leaderboards

View All Benchmarks

COCO (Common Objects in Context) - Object Detection

computer...object-d...instance...

Baseline Metrics

accuracy

89.2

map

0.4

iou

0.87

fOneScore

0.86

330,000

25,000

COCO-Seg (2026 Edition)

computer...instance...object-d...

Baseline Metrics

accuracy

85.2

map

33.9

iou

0.87

fOneScore

0.86

320,000

24,000

Open Images V7+ (Google)

computer...object-d...instance...

Baseline Metrics

accuracy

88.2

map

0.76

iou

0.87

fOneScore

0.86

250,000

18,500

Cityscapes Dataset

semantic...urban-sc...panoptic...

Baseline Metrics

miou

86.2

accuracy

91.5

fOneScore

0.88

420,000

8,900

ADE20K

scene-pa...semantic...computer...

Baseline Metrics

miou

57.8

accuracy

82.1

pixelAccuracy

81.4

310,000

5,400

COCO Panoptic

panoptic...instance...object-d...

Baseline Metrics

57.8

83.2

68.4

1,200,000

45,000

MMLU-Pro

llm-benc...general-...multi-st...

Baseline Metrics

accuracy

72.6

fOneScore

0.71

cot boost

12.5

920,000

24,000

HumanEval+

codingpythonfunction...

Baseline Metrics

pass at 1

86.2

pass at 10

94.5

edge case fail rate

4.2

450,000

18,500

GSM8K

mathreasonin...multi-st...

Baseline Metrics

accuracy

96.4

reasoning steps avg

4.5

error rate

2.1

1,100,000

52,000

Academic Datasets

Recently released datasets from research papers with EDA and analytics

View All Academic

Infinity-Chat

26k+ open-ended prompts designed to expose 'mode collapse' in LLM creativity.

nlpinstruct...creative...

Analytics Summary

26k+ open-ended prompts designed to expose 'mode collapse' in LLM creativity.

15,400

3,200

WorldModelBench

350+ physics-constrained scenarios to test video generation logic.

computer...video-ge...world-mo...

Analytics Summary

350+ physics-constrained scenarios to test video generation logic.

8,900

1,100

LiveBench

Monthly updated questions from arXiv, math competitions, and news.

llm-benc...reasonin...coding

Analytics Summary

Monthly updated questions from arXiv, math competitions, and news.

42,000

5,600

STSBench (STSnu)

43 diverse driving scenarios with 971 verified spatial reasoning QA pairs.

computer...autonomo...vlm-reas...

Analytics Summary

43 diverse driving scenarios with 971 verified spatial reasoning QA pairs.

6,500

890

WildBench

Real-world user queries evaluated using automated pairwise comparison.

llm-eval...rlhfuser-ali...

Analytics Summary

Real-world user queries evaluated using automated pairwise comparison.

21,000

2,800

OS-Marathon

Benchmarks agents on long-horizon, repetitive desktop tasks to test stability.

agentscomputer...robustne...

Analytics Summary

Benchmarks agents on long-horizon, repetitive desktop tasks to test stability.

3,200

450

XLRS-Bench

Ultra-high resolution (8.5k x 8.5k) remote sensing for MLLMs.

remote-s...multimod...satellit...

Analytics Summary

Ultra-high resolution (8.5k x 8.5k) remote sensing for MLLMs.

5,600

1,200

MuVR

Retrieving specific moments from long, untrimmed video streams.

video-re...computer...temporal...

Analytics Summary

Retrieving specific moments from long, untrimmed video streams.

4,100

670

AODRaw

7,700+ RAW sensor images for detection in adverse weather.

autonomo...object-d...low-ligh...

Analytics Summary

7,700+ RAW sensor images for detection in adverse weather.

2,800

530

Request Datasets

Didn't find what you were looking for? Submit a request and we'll help you find or create the dataset you need.

Request dataset

Discover AI datasetsacross platforms

AI-Powered Aggregation

Cityscapes Semantic

Cityscapes

BDD100K

Trending Now

Browse by Category

Recently Added

Featured Datasets

Benchmark Datasets

COCO (Common Objects in Context) - Object Detection

COCO-Seg (2026 Edition)

Open Images V7+ (Google)

Cityscapes Dataset

ADE20K

COCO Panoptic

MMLU-Pro

HumanEval+

GSM8K

Academic Datasets

Infinity-Chat

WorldModelBench

LiveBench

STSBench (STSnu)

WildBench

OS-Marathon

XLRS-Bench

MuVR

AODRaw

Request Datasets

Discover AI datasets
across platforms