Add readParquetFiles for partitioned parquet datasets #131

samimshoaib01 · 2026-01-17T22:07:28Z

The function:

Accepts either a single Parquet file or a directory

Recursively discovers .parquet files when given a directory

Reads each file using the existing readParquet

Vertically merges the results using the existing DataFrame Semigroup / Monoid instance

The existing readParquet behavior is unchanged.

readParquetFiles is re-exported from DataFrame so it is available as D.readParquetFiles.

Performance considerations

The implementation relies on existing DataFrame merge semantics (mconcat) and performs a recursive filesystem traversal for file discovery. No changes were made to Parquet decoding or in-memory column handling.

Testing

Manually tested by reading a partitioned dataset stored as nested directories of Parquet files.

If there is something Which i am missing kindly mention and all suggestions are welcom.

src/DataFrame/IO/Parquet.hs

samimshoaib01 · 2026-01-19T19:33:43Z

Kindly check if its alright

Add readParquetFiles for partitioned parquet datasets

b0ac551

mchav reviewed Jan 17, 2026

View reviewed changes

src/DataFrame/IO/Parquet.hs Show resolved Hide resolved

mchav reviewed Jan 17, 2026

View reviewed changes

src/DataFrame/IO/Parquet.hs Outdated Show resolved Hide resolved

Add readParquetFiles using glob for partitioned parquet datasets

0448c3e

mchav added 2 commits January 19, 2026 12:27

Refactor variable naming for pattern matching

daacbd9

Fix formatting of module exports in Parquet.hs

266df87

mchav merged commit 74565ef into mchav:main Jan 19, 2026
6 of 7 checks passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Add readParquetFiles for partitioned parquet datasets #131

Add readParquetFiles for partitioned parquet datasets #131

Uh oh!

samimshoaib01 commented Jan 17, 2026

Uh oh!

Uh oh!

Uh oh!

samimshoaib01 commented Jan 19, 2026

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

Add readParquetFiles for partitioned parquet datasets #131

Add readParquetFiles for partitioned parquet datasets #131

Uh oh!

Conversation

samimshoaib01 commented Jan 17, 2026

Uh oh!

Uh oh!

Uh oh!

samimshoaib01 commented Jan 19, 2026

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants