<div dir="rtl" style="text-align: right;">
<h1>معرفی فایل‌های خام</h1>
<p>گاهی اوقات داده‌ها را در قالب‌های عجیب دریافت می‌کنید و باید کد پایتون خود را برای پردازش داده‌ها بنویسید. خوشبختانه، انجام این کار ساده است.</p>
<p>برای این منظور، ما فرض می‌کنیم که داده‌های شما در نوعی فایل متنی وجود دارند. هر ردیف داده متناظر با یک ردیف در فایل متنی شما است.</p>
<p>برای مثال، ممکن است یک فایل داشته باشید که توسط علامت پایپ (|) جدا شده است. ممکن است به این شکل به نظر برسد:</p>
<pre>
James|22|M
Sarah|31|F
Mindy|25|F
</pre>
<p>در بالا ما ۳ ردیف داده داریم که هر کدام شامل ۳ مقدار هستند که توسط پایپ (|) جدا شده‌اند - نام، سن، و جنسیت.</p>
<p>ما می‌توانیم همین فایل را در پایتون برای پردازش با استفاده از 
tempfile
 ایجاد کنیم.</p>

</div>

In [1]:
import tempfile

tmp = tempfile.NamedTemporaryFile()

# فایل را برای نوشتن مقادیر اولیه باز می‌کنیم
with open(tmp.name, 'w') as f:
    f.write("James|22|M\n")
    f.write("Sarah|31|F\n")
    f.write("Mindy|25|F")

# فایل را می‌خوانیم و هر خط از آن را چاپ  می‌کنیم
with open(tmp.name, "r") as f:
    for line in f:
      print(line)

James|22|M

Sarah|31|F

Mindy|25|F


<div dir="rtl" style="text-align: right;">

<p>در بالا، ما از 
tempfile
 (خط ۶) برای ایجاد یک فایل که شامل سه ردیف داده است استفاده کردیم. 
 \n
  در انتهای دو ردیف اول داده‌ها (خط ۷-۸) به برنامه می‌گوید که خطوط جدیدی ایجاد کند.</p>
<h1>خواندن فایل‌های خام با پایتون</h1>
<p>اکنون به بررسی چگونگی ایجاد فایل نمی‌پردازیم و بیشتر بر روی باز کردن و استفاده از آن تمرکز می‌کنیم. به کد زیر توجه کنید:</p>

</div>


In [2]:
with open(tmp.name, "r") as f:
    for line in f:
      print(line)

James|22|M

Sarah|31|F

Mindy|25|F


<div dir="rtl" style="text-align: right;">

<p>ما از دستور 
open()
 برای خواندن فایل استفاده می‌کنیم. ابتدا نام فایلی که می‌خواهیم پردازش کنیم و سپس یک 
 r
  که به معنای خواندن
  (read)
   است را می‌گذرانیم.</p>
<p>از آنجا که ما از عملکرد 
with as
 در پایتون استفاده کردیم، آدرس اشاره‌گر به فایل ما اکنون به عنوان متغیر 
 f
  نمایش داده شده و تنها در این دامنه مرتبط است. این یک روش خوب برای خواندن فایل‌ها است زیرا شما نگران بستن دستگیره فایل نیستید. پس از داشتن یک آدرس اشاره‌گر به فایل، پایتون دسترسی به خطوط را بسیار آسان می‌کند. متغیر 
  f
   
   اکنون یک ماهیت تکرارپذیر است که هر تکرار آن یک خط از فایل است. بنابراین، وقتی ما عمل زیر را انجام می‌دهیم روی خطوط فایل مان حلقه می‌زنیم. کد زیر تنها این خطوط را چاپ می‌کند، اما از آنجا که ما دسترسی مستقیم به خطوط فایل خود داریم، می‌توانیم هر کاری که می‌خواهیم در پردازش خود انجام دهیم.</p>



</div>

In [None]:

for line in f


<div dir="rtl" style="text-align: right;">

<p> به عنوان مثال، در اینجا کدی است که فقط مقدار اول هر ردیف را می‌گیرد و آنها را به یک لیست اضافه می‌کند.</p>

</div>

In [3]:
import tempfile

tmp = tempfile.NamedTemporaryFile()

# فایل را برای نوشتن مقادیر اولیه باز می‌کنیم
with open(tmp.name, 'w') as f:
    f.write("James|22|M\n")
    f.write("Sarah|31|F\n")
    f.write("Mindy|25|F")

first_values = []  # لیستی برای ذخیره مقدار اولیه خطوط ایجاد می‌کنیم
with open(tmp.name, "r") as f:  # فایل را برای خواندن باز می‌کنیم
    for line in f:  # روی هر خط از فایل حلقه می‌زنیم
      row_values = line.split("|")  # کاراکترهای هر خط را بوسیله | جدا می‌کنیم و در لیست فرار می‌دهیم
      first_values.append(row_values[0])  # مقدار اولیه را به لیست‌مان اضافه می‌کنیم
      
print(first_values) # در نهایت لیست را چاپ می‌کنیم

['James', 'Sarah', 'Mindy']
