وارد کردن داده ها در پایتون (Python)
در این مقاله، نحوه وارد کردن انواع مختلف داده ها با استفاده از کتابخانه های مختلف پایتون را بررسی میکنیم. مانند pandas ، csv، openpyxl، xlrd، json، Pillow، SkLearn، MoviePy و OpenCV.
پایتون Python یک زبان برنامه نویسی همه کاره است که به طور گسترده برای تجزیه و تحلیل داده ها و محاسبات علمی استفاده می شود. یکی از وظایف ضروری در این حوزه ها، وارد کردن داده ها به پایتون برای پردازش و تجزیه و تحلیل است. در این مقاله، روشهای مختلف وارد کردن دادهها به Python را بررسی میکنیم.
انواع مختلف داده ها به شرح زیر است:
1. فایل های CSV
فایلهای CSV (مقادیر جدا شده با کاما) یک روش رایج برای ذخیره دادههای جدولی هستند و پایتون یک ماژول داخلی برای مدیریت آنها دارد. ماژول “csv” قابلیت خواندن و نوشتن فایل های CSV را فراهم می کند. برای وارد کردن یک فایل CSV با کتابخانه csv یا کتابخانه pandas، می توانید از کد زیر استفاده کنید:
import csv
with open(‘file.csv’, newline=”) as csvfile:
reader = csv.reader(csvfile)
for i in range(5):
row = next(reader)
print(row)
import pandas as pd
file=pd.read_csv(‘file.csv’)
file.head(5)
در اینجا، فایل “filename.csv” را در حالت خواندن باز می کنیم و یک شی خواننده CSV ایجاد می کنیم. سپس از تابع list() برای تبدیل شی خواننده به لیستی از لیست ها استفاده می کنیم، جایی که هر فهرست فرعی نشان دهنده یک ردیف در فایل CSV است.
2. فایل های اکسل
فایل های اکسل یکی دیگر از روش های رایج ذخیره سازی داده های جدولی است. پایتون چندین ماژول برای مدیریت فایل های اکسل دارد، از جمله pandas ، openpyxl و xlrd. در اینجا نحوه استفاده از pandas، openpyxl و xlrdmodule برای وارد کردن پنج ردیف اول یک فایل اکسل آمده است:
import pandas as pd
file=pd.read_excel(‘file.xlsx’)
file.head(5)
import openpyxl
workbook = openpyxl.load_workbook(‘file.xlsx’)
worksheet = workbook.active
for i, row in enumerate(worksheet.iter_rows(values_only=True)):
if i == 5:
break
for cell in row:
print(cell, end=’\t’)
print(‘\n’)
import xlrd
workbook = xlrd.open_workbook(‘file.xls’)
worksheet = workbook.sheet_by_index(0)
for i in range(min(5, worksheet.nrows)):
row = worksheet.row_values(i)
for cell in row:
print(cell, end=’\t’)
print(‘\n’)
در اینجا از تابع load_workbook() برای باز کردن فایل اکسل و از ویژگی active برای انتخاب sheet فعال استفاده می کنیم. سپس روی هر ردیف در sheet تکرار می کنیم و آن را به یک لیست اضافه می کنیم. توجه: panda و openpyxl میتوانند فایلهای xlsx و xlrd میتوانند فایل xls را دریافت کنند.
3. فایل های متنی (Text files)
فایل های متنی روشی ساده برای ذخیره سازی داده ها هستند و پایتون به راحتی می تواند آنها را بخواند و بنویسد. در اینجا نحوه وارد کردن یک فایل متنی در پایتون آمده است:
with open(‘file.txt’) as file:
content = file.read()
print(content)
در اینجا، فایل “filename.txt” را در حالت خواندن باز می کنیم و از متد read() برای خواندن کل فایل به صورت string استفاده می کنیم. سپس با استفاده از متد splitlines() string را به خطوط تقسیم کرده و در یک لیست ذخیره می کنیم.
4. فایل های JSON
JSON (JavaScript Object Notation) یک فرمت داده سبک وزن است که به طور گسترده برای تبادل داده بین وب سرویس ها و برنامه ها استفاده می شود. پایتون یک ماژول داخلی به نام json دارد که می تواند داده های JSON را مدیریت کند. در اینجا نحوه وارد کردن فایل JSON در پایتون آمده است:
import json
with open(‘file.json’, ‘r’) as f:
data = json.load(f)
data
در اینجا، فایل “filename.json” را در حالت خواندن باز می کنیم و از روش json.load() برای بارگذاری داده ها از فایل در یک شی پایتون استفاده می کنیم.
5. وارد کردن داده های تصویر در پایتون:
راههای مختلفی برای وارد کردن دادههای تصویر در پایتون وجود دارد، اما متداولترین ماژولهای مورد استفاده Pillow، SkLearn و OpenCV هستند.
- Pillow
Pillow یک کتابخانه تصویربرداری پایتون است که از باز کردن، دستکاری و ذخیره فرمت های مختلف فایل های تصویری پشتیبانی می کند. برای وارد کردن تصویر می توانید از کد زیر استفاده کنید:
from PIL import Image
image = Image.open(‘person1.jpg’) # Open an image file
image.show() # Show the imageHere, we use the Image.open() method to open an image file and store it in the image variable. We then use the show() method to display the image.
- OpenCV
OpenCV یک کتابخانه بصری سازی کامپیوتری محبوب است که عملکردهای مختلف پردازش تصویر و ویدئو را ارائه می دهد. از بسیاری از فرمت های فایل تصویری پشتیبانی می کند و قابلیت پردازش سریع تصویر را فراهم می کند. برای وارد کردن تصویر می توانید از کد زیر استفاده کنید:
import cv2
image = cv2.imread(‘person1.jpg’) # Load an image file
cv2.imshow(‘Image’, image) # Show the image
cv2.waitKey(0)
cv2.destroyAllWindows()
در اینجا از متد cv2.imread() برای بارگذاری یک فایل تصویری و ذخیره آن در متغیر image استفاده می کنیم. سپس از متد cv2.imshow() برای نمایش تصویر و از متدهای cv2.waitKey() و cv2.destroyAllWindows() برای مدیریت ورودی کاربر و بستن پنجره استفاده می کنیم.
python
- Scikit-image
Scikit-image یا skimage یک کتابخانه پایتون برای پردازش تصویر و وظایف بصری سازی کامپیوتری است. عملکردهای مختلفی را برای دستکاری، تبدیل و تجزیه و تحلیل تصویر فراهم می کند. برای وارد کردن تصویر می توانید از کد زیر استفاده کنید:
from skimage import io
image = io.imread(‘person1.jpg’) # Load an image file
io.imshow(image) # Show the image
io.show()Here, we use the io.imread() method to load an image file and store it in the image variable. We then use the io.imshow() and io.show() methods to display the image.
Skimage همچنین چندین عملکرد را برای پیش پردازش تصویر ارائه می دهد، مانند تغییر اندازه تصویر، تبدیل رنگ و فیلتر کردن.
6. وارد کردن داده های ویدیویی در Python:
پایتون چندین ماژول برای وارد کردن داده های ویدیویی از جمله OpenCV، MoviePy و PyAV ارائه می دهد.
- OpenCV
OpenCV بسیاری از عملکردهای پردازش ویدئو از جمله ضبط و پخش فایل های ویدئویی را ارائه می دهد. برای وارد کردن ویدیو می توانید از کد زیر استفاده کنید:
import cv2
cap = cv2.VideoCapture(‘2girl_video2.mp4’) # Open a video file
while cap.isOpened(): # Read the video frames
ret, frame = cap.read()
if ret:
cv2.imshow(‘Video’, frame) # Display the video frames
if cv2.waitKey(25) & 0xFF == ord(‘q’):
break
else:
break
cap.release() # Release the resources
cv2.destroyAllWindows()Here, we use the cv2.VideoCapture() method to open a video file and store it in the cap variable. We then use a loop to read each video frame using the cap.read() method, display the frames using the cv2.imshow() method, and handle user input using the cv2.waitKey() method. We release the resources using the cap.release() and cv2.destroyAllWindows() methods.
نتیجه:
وارد کردن داده ها در پایتون یک کار مهم در تجزیه و تحلیل داده ها و محاسبات علمی است. پایتون ماژول های مختلفی را برای مدیریت انواع مختلف فرمت های داده ارائه می دهد. پایتون چندین ماژول و کتابخانه برای وارد کردن و پردازش داده های تصویری و ویدئویی نیز فراهم می کند.
برای خرید لایسنس نرم افزار Power BI ، میتوانید از خدمات ما استفاده نموده و درخواست خود را از طریق فرم زیر ثبت نمایید.