Python:日本語の句読点をトリガーにして改行コードを挿入する

記事公開日:
最終更新日:

Sponsored Links

実行環境はWindows、Python2.7です。
Pythonで開発していて、日本語の句読点をトリガーとして改行コードを挿入するサンプルコードをメモ代わりに書いています。
改行コードは Windows/Mac/Linux でそれぞれ異なりますが、Pythonの内部的には 

\n

 として処理されているらしいです。

下記のコードにあるように os.linesep として改行コードを付加すれば、環境に合わせた改行コードを挿入することができ便利です。

あと、Pythonで日本語の文字列は基本的に unicode で処理されているので、サンプルでは unicode で読み込んだと想定した文字列を utf-8 に一度変換して、文字列置換を行っています。

#!/usr/bin/env python
# -*- coding: utf-8 -*-
import os
# 句読点に、改行コードを追加
text = u"ハロー。ワールド。Pythonで句読点を扱う。"
text = text.encode('utf-8')
text = text.replace("。", "。" + os.linesep)
print text
"""
#以下、出力結果
ハロー。
ワールド。
Pythonで句読点を扱う。
"""

About
Amelt.net,LLCの創業者で、費用対効果の高い統合webマーケティングによりビジネスパートナーとして継続的にサポート。詳しいより。ブログの更新情報facebookページGoogle+そしてTwitter、またRSSfeedlyLINE@にてお知らせしていますのでフォローよろしくお願い致します。


Sponsored Links