C/PVA : Python ile Veri Analizi
3 gün (18 Saat) Orta Sınıf / Online NoSQL ve Büyük Veri
Python ile her türlü veri kaynağına bağlanabilir, farklı tipteki ve hızdaki veriyi işleyebilirsiniz. Python ile veri işlemek için tek bir makine üzerinde çalışan platformları tercih edebileceğiniz gibi, limitsiz işlemci gücüne erişebilen dağıtık mimariye sahip platformları da tercih edebilirsiniz. "Python ile Veri Analizi" eğitiminde veri kaynaklarını bağlanmak için çeşitli kütüphaneleri kullanıyor, veri işleme konusunda son derece yaygın olarak tercih edilen numpy ve pandas kütüphanelerine odaklanıyor. Veri görselleştirme için gerekli olan matplotlib kütüphanesini inceliyoruz.
Eğitim İçeriği
Module 1: Veri Analitiği
- Veri Analitiği Tipleri
- Veri Nedir? Türleri Nelerdir?
- Veri Analizi Süreci ve Mücadele Noktları
- Büyük Veri, NoSQL, Veri Gölü
Module 2: Package ve Module Kavramları
- İndirme ve Ortama Dahil Etme
- Toplu Halde Paket İndirme
- Path ekleme
- Package ve Module oluşturma
- import ve reload Etme
- Farklı from, import Yöntemleri ve Etkileri
- Virtual Environmentlar oluşturmak
Module 3: Dosyalar ile Çalışma
- os Kütüphanesi ve Shell komutlarını Kullanarak Klasorlerle Çalışmak
- shelve Kütüphanesi ile Dosyalara Yazma Okuma
- open ile Dosyalara Yazma Okuma
- with kullanımı
- csv Veri Tipi İle Çalışma
- json Veri Tipi ile Çalışma
Module 4: Veri Tabanları İle Çalışmak
- DBAPI Tanıma
- sqlite3 ile Çalışma
- MSSQL ve Oracle gibi RDBMS'ler ile Çalışma
- Veritabanı Nesneleri Oluşturma
- Veri Ekleme,Güncelleme ve Okuma
Module 5: Webden İçerik Okuma
- urlretrieve ile Dosya İndirme
- urlopen ile İçerik Okuma
- encode, decode Kavramı
- re Kütüphanesi ile Regex İfadeleri Kullanarak Arama Yapma
- requests ile Get ve Post İstekleri Oluşturma
- BeautifulSoup ile HTML Etikelerine Erişmek
Module 6: Array ve Matrix Veri Yapıları (numpy)
- numpy Kütüphanesi ve Kullanım Alanları
- Array ve Matrix Tanımlama
- Nesneler Hakkında Bilgi Alma
- Bazı Matematiksel İşlemler
- Array Fonksiyonları
- Array Elemanlarına Erişme Yöntemleri
- where Kullanımı
- Numpy ile Veri Yazma Okuma
Module 7: Seri ve DataFrame Ver Yapıları (pandas)
- pandas Kütüphanesi ve Kullanım Alanları
- Seri ve DataFrame Tanımalama
- DF Yapısını Değiştirme
- DF Hakkında Bilgi Almak
- DF Elemanlarına Ulaşma Yöntemleri
- query, where, isin, filter kullanımı
- Değer Atama, Satır ve Sutun Ekleme
- None Tipi ile Çalışma
- Applmap, apply ve map Fonksiyonları Kullanımı
- groupby ile Veri Gruplama
- agg ile Veri Özetleme
- Hiyerarşik Yapılar ile Çalışma
- Birden Fazla DF'i Birleştirme (merge, join, concat)
- DF Şekillendirme (pivot, melt)
- DateTime Indexler ile Çalışma
- Grafik çizimleri
Module 8: Seri ve DataFrame Okuma Yazma (pandas io)
- pandas ile csv Dosyalarına Bağlanma
- converter ile Veri Düzeltme
- pandas ile Excel Dosyalarına Bağlanma
- pandas ile RDBMS'lere Bağlanma
- sqlalchemy Tanıma
- Style ve Option Kullanımı
Module 9: Veri Görselleştirme (matplotlib)
- matplotlib Kütüphanesi Esasları
- Tek Plot ile Çalışma
- Grafik Özelliklerini Düzenlemek
- Birden Fazla Plot ile Çalışmak
- Grafik Tiplerini Tanıma
- Grafikleri Kaydetmek
- imshow ile Resim Görüntüleme
- rcParams ile İleri Düzey Ayarlar
- Animatif Grafik Oluşturma
Öncesinde Önerilenler
-
Data Engineer
Büyük Verinin İşlenmesi, Yönetimi, Veri Kalitesini Arttırma, Bulut Bilişim ve Veri Bilimi için Kodlama, Spark ve Hadoop gibi Dağıtık Mimariler ile Çalışma.
- C/STATI : Betimleyici ve Çıkarımsal İstatistik Temelleri
- C/STATF : İstatistik Esasları
- C/STATF+ : İstatistik Esasları (Genişletilmiş)
- MS/20761C : Querying Data with Transact-SQL
- C/TVTS : T-SQL ile Veri Tabanı Sorgulama (Microsoft SQL Server)
- MS/20777A : Implementing Microsoft Azure Cosmos DB Solutions
- C/PBSSBI : Power BI ile Self Service BI
- C/IRFDS : R Dili ve R ile Veri Analizi
- C/PDE : Python Dili Esasları
-
Data Scientist
Yapay Zeka, Makine Öğrenimi, Derin Öğrenme Teknikleri ile Büyük Veri Kümelerinden Desen ve Eğilim Keşfetme
- C/STATI : Betimleyici ve Çıkarımsal İstatistik Temelleri
- C/STATF : İstatistik Esasları
- C/STATF+ : İstatistik Esasları (Genişletilmiş)
- MS/20761C : Querying Data with Transact-SQL
- C/TVTS : T-SQL ile Veri Tabanı Sorgulama (Microsoft SQL Server)
- C/PBSSBI : Power BI ile Self Service BI
- C/IRFDS : R Dili ve R ile Veri Analizi
- C/PDE : Python Dili Esasları
Sonrasında Önerilenler
-
Data Engineer
Büyük Verinin İşlenmesi, Yönetimi, Veri Kalitesini Arttırma, Bulut Bilişim ve Veri Bilimi için Kodlama, Spark ve Hadoop gibi Dağıtık Mimariler ile Çalışma.
- MS/20762C : Developing SQL Databases (Microsoft SQL Server)
- CMS/20764C : Administering a SQL Database Infrastructure
- MS/DP-300 : Administering Relational Databases on Microsoft Azure
- MS/20765C : Provisioning SQL Databases
- MS/10987C : Performance Tuning and Optimizing SQL Databases
- CMS/20767B : Implementing a SQL Data Warehouse
- MS/20768C : Developing SQL Data Models
- MS/10990C : Analyzing Data with SQL Server Reporting Services
- C/DMDQ : Veri Yönetimi ve Veri Kalitesi
- C/ADMT : İleri Veri Modelleme Teknikleri
- CMS/DP-203 : Data Engineering on Microsoft Azure
- C/AZSC-Synapse : Fundamentals of Azure Synapse Analytics
- C/BDA-Synapse : Data Analytics Solutions Using Azure Synapse Analytics
- MS/DP-500 : Designing and Implementing Enterprise-Scale Analytics Solutions Using Microsoft Azure and Microsoft Power BI
- CMS/DP-601T00A : Implementing a Lakehouse with Microsoft Fabric
- C/DAWS : Big Data Analysis with Spark
- C/PSS : PySpark ile Spark SQL
- C/VBL : Veri Bilimcileri için Linux
- C/VMUP : Veri Mimarisinde Ustalaşma Programı
-
Data Scientist
Yapay Zeka, Makine Öğrenimi, Derin Öğrenme Teknikleri ile Büyük Veri Kümelerinden Desen ve Eğilim Keşfetme
- C/DMDQ : Veri Yönetimi ve Veri Kalitesi
- C/ADMT : İleri Veri Modelleme Teknikleri
- MS/AI-900 : Microsoft Azure AI Fundamentals
- MS/AI-100 : Designing and Implementing an Azure AI Solution
- MS/DP-100 : Designing and Implementing a Data Science Solution on Azure
- C/MOE : Makine Öğrenimi Esasları
- C/ADSB : Accelerated Data Science for Business
- C/AZSC-Synapse : Fundamentals of Azure Synapse Analytics
- MS/DP-500 : Designing and Implementing Enterprise-Scale Analytics Solutions Using Microsoft Azure and Microsoft Power BI
- CMS/DP-601T00A : Implementing a Lakehouse with Microsoft Fabric
- C/DAWS : Big Data Analysis with Spark
- C/PSS : PySpark ile Spark SQL
- C/VBL : Veri Bilimcileri için Linux