Posts

CSV Yerine Parquet Kullanımı

 Verileri csv ile kullanmak yerine sıkıştırılmış parquet formatında kullanabiliriz.  import numpy as np import pandas as pd # Create a dataset with 1 million rows and 10 columns  np.random.seed(256) data = np.random.randint(0, 2**63, size=(1000000, 10)) df = pd.DataFrame(data, columns=[f'col{str(i)}' for i in range(10)]) # Write data to Parquet file df.to_parquet('example.parquet') # Write data to CSV file df.to_csv('example.csv', index=False) import os print("Parquet file size:", os.path.getsize('example.parquet')) print("CSV file size:", os.path.getsize('example.csv'))  Parquet file size: 82805080 CSV file size: 198796161