[Python] Pandas 基礎教學

本篇文章主要為資料科學導論中的 Python 做資料前處理以及 DataFrame 所使用到的 Pandas lib 教學,用於描述如何安裝 Pandas 以及相關基礎方法介紹。 Pandas 介紹 Pandas 是 python 的一個數據分析 lib,2009 年底開源出來,提供高效能、簡易使用的資料格式(Data Frame)讓使用者可以快速操作及分析資料,主要特色描述如下: »

[Python] Python 安裝與基礎教學

本篇文章主要為資料科學導論中的 Python 程式語言的基礎教學,用於描述如何安裝 Python 環境以及 Python 相關基礎語法介紹,相關內容大綱如下所示。 大綱 安裝 Python 與 Jupyter Python 與資料科學 Python 特色 Python 環境架構與 Python Script Python 語言與資料科學 Python 語法基礎 »

[ Big data ] Apache Zookeeper 與 Kafka 安裝教學

上一篇 Apache Kafka 介紹 文章有提到 Kafka 基本介紹以及串接教學,但由於安裝部分是透過 Hortonworks 安裝包直接做安裝,會連同一些額外的套件一起安裝,因此本篇教學主要是以如何只安裝 Zookeeper 用來管理 Kafka 叢集為主。 Apache Zookeeper Zookeeper 介紹 ZooKeeper 是一個開源管理分散式的服務套件,用來處理分散式應用程式協調,以Fast Paxos 演算法為基礎, »

[ Big data ] Apache Kafka 使用 Python 介接

本文章將展示如何使用 Python 串接 Kafka Message Broker,並傳送模擬系統 Log 資料至 Topic,如果對 Kafka 介紹、安裝或使用方式還不了解的朋友,可以參考之前寫的文章 Apache Kafka Message Broker 使用教學。 Kafka 部分 Step 1. 確認目前 Kafka »