In [1]:
# 形態素解析を行う

from janome.tokenizer import Tokenizer # ①janome.tokenizerをインポート
t = Tokenizer()                        # ②Tokenizerオブジェクトを生成
tokens = t.tokenize('わたしはPythonのプログラムです')  # ③形態素解析
for token in tokens:                   # ③解析結果のリストから抽出
    print(token)

わたし	名詞,代名詞,一般,*,*,*,わたし,ワタシ,ワタシ
は	助詞,係助詞,*,*,*,*,は,ハ,ワ
Python	名詞,固有名詞,組織,*,*,*,Python,*,*
の	助詞,連体化,*,*,*,*,の,ノ,ノ
プログラム	名詞,サ変接続,*,*,*,*,プログラム,プログラム,プログラム
です	助動詞,*,*,*,特殊・デス,基本形,です,デス,デス


In [2]:
tokens

[<janome.tokenizer.Token at 0x2c9a420d208>,
 <janome.tokenizer.Token at 0x2c9a420d248>,
 <janome.tokenizer.Token at 0x2c9a420d288>,
 <janome.tokenizer.Token at 0x2c9a420d2c8>,
 <janome.tokenizer.Token at 0x2c9a420d308>,
 <janome.tokenizer.Token at 0x2c9a420d388>]

In [3]:
print(tokens[0])

わたし	名詞,代名詞,一般,*,*,*,わたし,ワタシ,ワタシ


In [4]:
# 内包表記を使って文章の中のすべての形態素の見出しを取り出す
[token.surface for token in tokens]

['わたし', 'は', 'Python', 'の', 'プログラム', 'です']

In [5]:
# リストの1つ目のTokenオブジェクトから品詞を取り出す
print(tokens[0].part_of_speech)

名詞,代名詞,一般,*


In [6]:
# リストの1つ目のTokenオブジェクトから活用型を取り出す
print(tokens[0].infl_type)

*


In [7]:
# リストの1つ目のTokenオブジェクトから原型を取り出す
print(tokens[0].base_form)

わたし


In [8]:
# リストの1つ目のTokenオブジェクトから読みを取り出す
print(tokens[0].reading)

ワタシ


In [9]:
# リストの1つ目のTokenオブジェクトから発音を取り出す
print(tokens[0].phonetic)

ワタシ


In [10]:
# テキストファイルのデータをまとめて読み込む

file = open(
    'sample.txt',       # ソースファイルと同じ場所にあるrandom.txtを開く
    'r',                # 読み取りモード
    encoding = 'utf_8'  # テキストファイルのエンコーディング方式を指定
    )
data = file.read()   # ファイル終端までのすべてのデータを取得

file.close()             # ファイルオブジェクトをクローズ
lines = data.split('\n') # 改行で区切った文字列リストを取得
for line in lines:       # リストから要素を1つずつ取り出す
    print(line)

　Pythonのソースコードの書き方は、オブジェクト指向、命令型、手続き型、関数型などの形式に対応していますので、状況に応じて使い分けることができます。
　オブジェクト指向を使えばより高度なプログラミングを行えますが、命令型、手続き型、関数型はプログラムを書くための基本なので、まずはこれらの書き方を学んでからオブジェクト指向に進むのが一般的です。
　Pythonの用途は広く、PC上で動作する一般的なアプリケーションの開発から、Webアプリ、ゲーム、画像処理をはじめとする各種自動処理に使われる一方、統計分析、AI（人工知能）開発のためのディープラーニング（深層学習）の分野で多く利用されています。



In [11]:
# テキストファイルから1行ずつリストに読み込む

file = open(
    'sample.txt',           # ソースファイルと同じ場所にあるrandom.txtを開く
    'r',encoding = 'utf_8'  # 読み取りモード
    )
lines = file.readlines()  # 1行ずつ読み込む(各要素の末尾に改行文字) file.close()
for line in lines:
    print (line)

　Pythonのソースコードの書き方は、オブジェクト指向、命令型、手続き型、関数型などの形式に対応していますので、状況に応じて使い分けることができます。

　オブジェクト指向を使えばより高度なプログラミングを行えますが、命令型、手続き型、関数型はプログラムを書くための基本なので、まずはこれらの書き方を学んでからオブジェクト指向に進むのが一般的です。

　Pythonの用途は広く、PC上で動作する一般的なアプリケーションの開発から、Webアプリ、ゲーム、画像処理をはじめとする各種自動処理に使われる一方、統計分析、AI（人工知能）開発のためのディープラーニング（深層学習）の分野で多く利用されています。



In [12]:
# 1行ずつ読み込みできるファイルオブジェクトを利用する

with open('sample.txt',  # ファイル名
          'r',                # モード
          encoding = 'utf_8'  # エンコード方式
          ) as file:          #ファイルオブジェクトを変数fileに保持する
    for line in file:
        print(line)

　Pythonのソースコードの書き方は、オブジェクト指向、命令型、手続き型、関数型などの形式に対応していますので、状況に応じて使い分けることができます。

　オブジェクト指向を使えばより高度なプログラミングを行えますが、命令型、手続き型、関数型はプログラムを書くための基本なので、まずはこれらの書き方を学んでからオブジェクト指向に進むのが一般的です。

　Pythonの用途は広く、PC上で動作する一般的なアプリケーションの開発から、Webアプリ、ゲーム、画像処理をはじめとする各種自動処理に使われる一方、統計分析、AI（人工知能）開発のためのディープラーニング（深層学習）の分野で多く利用されています。

