前回紹介した、mplfinanceの使い方の続編です。前回はただ単純に四本値でローソクチャートを書きましたが、今回はそれに各種テクニカル指標等を追加する方法を紹介します。
参考: mplfinanceで株価チャートを描く
免責事項
本記事では株式や為替などの金融商品の価格に関するデータをサンプルとして利用しますが、効果や正当性を保証するものではありません。本ブログを利用して損失を被った場合でも一切の責任を負いません。そもそも、この記事ではライブラリを使って図に線や点を追加する方法を紹介しているだけであり、著者自身がこの記事で登場している指標の投資における有用性を検証していませんし、投資にも利用していません。あくまでもこういうコードを書いたらこう動くという例の紹介です。
おきまりの文章が終わったのでやってきましょう。前回同様、こんな感じのデータがあるとします。
print("データ件数:", len(price_df))
# データ件数: 182
print(price_df.head(5))
"""
open high low close volume
date
2022-01-04 3330.0 3340.0 3295.0 3335.0 75300.0
2022-01-05 3355.0 3370.0 3320.0 3360.0 62200.0
2022-01-06 3345.0 3370.0 3305.0 3305.0 67200.0
2022-01-07 3315.0 3330.0 3265.0 3295.0 84500.0
2022-01-11 3300.0 3300.0 3215.0 3220.0 87400.0
"""
前回はこれをただそのまま表示しましたが、今回はそれに追加して以下の情報を追加で書いていこうと思います。追記する場所として、四本値のローソク足のパネル、出来高のグラフのパネル、新しいパネルを用意してそこに書き込む、の3種類ができるということ、何かしらの指標を線で表示することや特定の点にマーカーをプロットできる、ということを例示するために以下のような例を考えました。
- 20日間の高値、安値の線 (四本値のパネル)
- 高値、安値を更新した点のプロット(四本値のパネル)
- 過去3日間の出来高の合計(出来高のパネル)
- 前日の終値と当日の終値の差分(新規のパネル)
まずプロットするデータを作ります。データは四本値のデータと同じ長さで、インデックスの日付が共通のDataFrameかSeriesである必要があります。高値線や安値線などのテクニカル指標の場合は大丈夫雨だと思うのですが、1~2ヶ所点をプロットしたいだけ、といった場合であっても、点をプロットない場所は全部NaN値を入れる形で、同じ長さのデータを作らなければなりません。それだけ気をつければ特に詰まるところはないと思います。
まぁ、元のデータのDataFrameに列を追加する形で作っていけば確実でしょう。
高値安値とその更新した点は次のように作りました。更新点はちょっと上下にずれた位置にプロットしたかったので、それぞれ1.02倍/0.98倍しています。
import pandas as pd
import numpy as np
# 高値線、安値線
price_df["h_line"] = price_df.rolling(20, min_periods=1).max()["high"]
price_df["l_line"] = price_df.rolling(20, min_periods=1).min()["low"]
# 高値、安値を更新した日付を算出
h_breakout_flg = price_df["h_line"].shift(1) < price_df["high"]
l_breakout_flg = price_df["l_line"].shift(1) > price_df["low"]
# 更新日にプロットする値を用意する。
price_df["h_breakout"] = np.nan
price_df["l_breakout"] = np.nan
price_df.loc[h_breakout_flg, "h_breakout"] = price_df.loc[h_breakout_flg, "high"] * 1.02
price_df.loc[l_breakout_flg, "l_breakout"] = price_df.loc[l_breakout_flg, "low"] * 0.98
出来高の3日の和と終値の前日との差分はそれぞれ次のように作れます。
price_df["volume_sum"] = price_df.rolling(3)["volume"].sum()
price_df["close_diff"] = price_df["close"].diff()
これで、サンプルデータが出揃ったので可視化していきます。ドキュメントは前回同様Githubのサンプルコードを参照します。今回見るのはこれです。
参考: mplfinance/addplot.ipynb at master · matplotlib/mplfinance
ドキュメントは頼りないので必要に応じてソースコードもみましょう。
チャートに指標を追加するには、plotメソッドを呼び出すときに、addplot 引数に追加したい指標の情報をdictで渡します。複数追加したい時は追加したい指標の数だけのdictをlistにまとめて渡します。(今回やるのはこちら)。
addplot に渡す辞書というのは以下の例のような結構大掛かりな辞書です。
{'data': date
2022-01-04 NaN
2022-01-05 3437.4
2022-01-06 NaN
2022-01-07 NaN
2022-01-11 NaN
...
2022-09-26 NaN
2022-09-27 NaN
2022-09-28 NaN
2022-09-29 NaN
2022-09-30 NaN
Name: h_breakout, Length: 182, dtype: float64,
'scatter': False,
'type': 'scatter',
'mav': None,
'panel': 0,
'marker': '^',
'markersize': 18,
'color': None,
'linestyle': None,
'linewidths': None,
'edgecolors': None,
'width': None,
'bottom': 0,
'alpha': 1,
'secondary_y': 'auto',
'y_on_right': None,
'ylabel': None,
'ylim': None,
'title': None,
'ax': None,
'yscale': None,
'stepwhere': 'pre',
'marketcolors': None,
'fill_between': None}
このdictデータを自分で作るのは大変です。そこで、mplfinance が専用のメソッド、make_addplot というのを持っているのでこれを使います。これを使って、追加する指標のデータと、どのグラフに書き込むのか(panel)可視化の方法(type, ‘line’, ‘bar’, ‘scatter’, ‘step’から選択)、マーカーや線のスタイル、大きや色、などの情報と合わせて渡すことでデータを作ってくれます。 (メインの四本値のデータよりそこに加筆する指標を先にライブラリに渡すのって微妙に直感的で無くて使いにくいですね。)
例えば、以下のようにすることで加筆データを生成できます。make_addplotに指定できる引数は上のサンプル辞書のkeyを見るのが早いと思います。だいたいイメージ通り動きます。
import mplfinance as mpf
adp = [
# 高値安値線。 panel=0 と指定し、四本値と同じパネルを指定
mpf.make_addplot(price_df[["h_line", "l_line"]], type='step',panel=0),
# 高値更新位置。 scatter を指定し、markerで上向三角形を指定
mpf.make_addplot(price_df["h_breakout"], type='scatter',panel=0, marker="^"),
# 安値更新位置。 scatter を指定し、markerで下向三角形を指定
mpf.make_addplot(price_df["l_breakout"], type='scatter',panel=0, marker="v"),
# 出来高の和。 panel=1 とすると 出来高のパネルを指定したことになる。 line を指定して折れ線グラフに。
mpf.make_addplot(price_df["volume_sum"], type='line',panel=1, linestyle="--", color="g"),
# 終値の前日差分。棒グラフのサンプルも欲しかったのでbarを指定。panel=2とすると新規のパネルが追加される
mpf.make_addplot(price_df.close.diff(), type='bar',panel=2),
]
さて、これで加筆データができました。 注意する点としてはpanel ですね。panel=0は四本値のグラフで固定ですが、panel=1は次のチャート描写のメソッドで、出来高の表示をするかどうか指定するvolume引数の値で挙動が変わります。Trueなら、出来高のグラフがpanel=1で、panel=2以降が新規のグラフです。一方Falseなら、panel=1から新規のグラフです。番号を飛ばすことができず、panel=1がないとpanel=2は指定できないので注意してください。
では、前回のグラフに追加して、上記のadpの値も渡してみます。今回、パネルが3個になりますが、panel_ratios でそれぞれの幅の調整ができます。メインの四本値のパネルを大きめにしておきました。
mpf.plot(
price_df,
volume=True, # 出来高も表示
mav=[10, 20], # 移動平均線
addplot=adp, # 追加指標
figratio=(3, 2), # 図全体の縦横比
panel_ratios=(2, 1, 1), # パネルの縦幅の比率
)
出来上がった図形がこちらです。
いい感じですね。細かい話ですが、高値安値線はtypeをstepにしてカクカクした線にしていて、高値の方に引いた線はtypeをlineにして斜めにつながる線にしています。好みの問題ですがこういう微調整ができるのが良いですね。
最初はデータの準備等に戸惑ったり、思うような微調整に苦戦したりするかもしれませんが、一回作ってしまうと、あとは銘柄を入れ替えたり期間を変えたりしながらパラパラといろんな検証ができます。scatterで自分の仕掛けと手仕舞いのポイント等を入れて検証したりってことも可能ですね。