2024年のまとめ

今年も1年間お疲れ様でした。あっという間の1年間でしたね。

この1年間はデータサイエンティストとして、そして技術系のブロガーとしては激動の1年間だったと思います。なんといってもLLMの発展の影響が色々なところに出てきました。そしてプライベートでも色々イベントの多い1年でした。

このブログのこと

このブログに関しては(少し遅れた日もありますが記事数は)なんとか目標通り週1本のペースを維持することができ、この記事で今年53本目になります。合計では671本になりました。

ただしその一方で、LLMの影響か?とも考えているのですがアクセス数は徐々に下がっています。自分の学習や調べ物を考慮しても、最初からAIに聞きそれを元に公式ドキュメントをあたる対応をとることが増え、他の人の記事を参照して調べるということがかなり減りました。
そして、おそらくそれは他の人たちも同じで、何か調べてこのブログがヒットするという機会が減っているのかなとも思います。

また、データサイエンティストとか機械学習とか統計学等々のブームはLLMを除いて落ち着いてきて、新規に流入してくる人も減ったのかなぁと感じています。LLMはほとんどの人にとっては、他社が開発したサービスを利用するだけですからね。

そういったわけで、アクセスいただいたユーザー数などのこのブログの指標は昨年の半分程度に落ちており、しかも年始から年末にかけて下降トレンドなので来年はもっと下がる見通しです。

僕個人としてもアクセス数などの指標をモチベーションにするのは避けるようになってきました。というのもそれらの指標を気にしているとダイレクトにモチベーションが下がってしまって記事の質が下がったり更新が遅れたりといったことにつながってしまっているからです。

記事を書くことが自分のスキルアップにつながっている感覚はあり、直近の転職ではこのブログの存在にも大いに助けられた感覚はあるのでなんらかの形で続けたいのですがなかなか難しいところですね。

このブログ以外の発信について

さて、このブログは低調ですが、この1年間はnoteにも月1本の記事を投稿してきました。こちらも年間12本の目標達成です。noteの方は会社の看板も背負ってますし業務に関することを書きやすいということもあり結構実践に踏み込んだ記事を揃えることができたと思います。

とはいえ、このブログが4~5本、noteが1本という更新はなかなかしんどかったですね。

項目反応理論のよりテクニカルな話をもっと書きたいと思ってはいるのですがそれはこのブログになるのかnoteになるのかは未定です。

お仕事の話

昨年転職して現職について1年半ほど経過しました。教育関係のデータサイエンティストとしてだいぶ仕事が板に付いてきたと思えます。データ基盤の各種ツールが手に馴染んてきたこと、人間関係がしっかりできてきたこと、メインウェポンの項目反応理論が思いのほか面白くて学んでいて楽しいことなどが良い要因です。

仕事に関しては、来年早々の共通テストが正念場なので気を引き締めていきたいです。

私生活の話

趣味でポーカーをやっているのですが、とある大会で順調に勝ち進んで韓国で行われた決勝戦に招待していただけたのが今年のハイライトでした。

その他、マーダーミステリーを数十本やったり街歩きの謎解きに参加したり、ボードゲームで遊んだり、美術館や博物館に行くようになったりと趣味が広がる1年間でした。

この調子で来年も楽しんでいきたいと思います。

来年に向けて

来年のこのブログの更新ですが、更新ペースに関して目標を設定するのは一旦やめようと思っています。生成AIの発展により個人が運営している技術ブログというものの存在価値もだいぶ下がっていると思いますし、実際ニーズがなくなっている実感があるからです。

とはいえ何かしらの更新はしようと思うので月1本くらいは何か記事書けたらいいなと思ってはいます。noteと合わせて月に2本は何かしらの発信がある計算です。

今までのような小ネタを書いてもいいですし、それこそキャリア系の著名な方々が書いてるようなキャリア系のポエムや読み物記事を書いても良いかもしれません。

キャリア論的なことを語りだすと自分の成長が止まるような気がしてこれまで書いてこなかったのですが、自分もそろそろ40代に突入するような年になっています。自分の成長だけ優先してるわけにもいかないので後進の方々にとって何かしら有意義な発信ができたらいいなと思います。特に前職では採用等もやっていて1000人近くの候補者を選考してたりしますし、メンバー育成等も担当していたのでその辺の経験からも何か書ければと。

それではみなさま、今年も1年間ありがとうございました。また来年もよろしくお願いいたします。

2024年のご挨拶と今年の方針

新年明けましておめでとうございます。本年もよろしくお願いします。

今年のこのブログの運用方針ですが、2022年, 2023年と同じように週1回更新を目指していこうと思います。昨年後半からnoteもスタートしててそっちは月1回なのでアウトプットの総量としては少し増加するイメージです。

毎年年初の記事でこれを書くぞって宣言した内容ほど書けてない変な傾向にあるので、昨年書きたいのに書かなかった内容を少しでもまとめて行けたらいいなと思っています。それ以外だと、最近の自分の関心としては、pyMCとかStreamlit あたりを使い始めているのでこの辺で記事を書けるといいですね。SnowflakeとかReDashの記事を書いてもいいのですが仕事で使ってる系はnoteの方に回りそうです。

ブログ以外の目標

データサイエンティストとしてはせっかく新しい業界に転職したので、その業界のドメイン知識・技術を重点的に学んでいく一年にしたいと思っています。項目応答理論とかもっと幅広く教育工学全般について。今年の取り組みとしてはこれが一番重要かな。

株式の運用に使っている自作システム群の改良も続けていきます。昨年から本格的にJ-Quants APIを使っていますが今年はプランをもう一個上げて活用の幅を広げていくことを検討中です。

その自作システム群ではAmazon Aurora Serverless v1 を使っているのですが、これが2024年の12月末でサポート終了するとアナウンス がありました(2023/12/28に。年末にびっくりしました)。個人開発周りで今年一番重いのはこの移行作業ですね。v2は高いので採用したくなく、何か別のやり方を考えて移行していく必要があります。

そういった感じで、このブログ自体は昨年と変わらず細々と更新されていく形になると思いますがどうぞ本年もよろしくお願いいたします。

2023年のまとめ

早いもので今年も最後の月曜日を迎えました。この記事が今年最後の投稿になるので1年のまとめをやっていきます。

まず、このブログに関しては途中でサーバーの障害があり投稿が遅れたこともありますが、今年も無事毎週の継続更新を完遂できました。

アクセス数等も集計していきます。Google Analyticsのユニバーサルアナリティクスがサービス終了してしまったので、今年からGA4の集計です。そのため基準が変わってしまったので昨年比は参考値でですが結果は以下のようなりました。(GA4基準で言うところの総ユーザー数とpage_viewイベント数を数えています。)

– 累計記事数 618記事 (この記事含む。昨年時点566記事)
– 総ユーザー数 254,463人 (昨年実績 272,075人 UA基準)
– page_viewイベント数 461,717回 (昨年実績 476,587回 UA基準)
(これらの数値は年が変わった段階でもう一回更新します)

記事数は無事に600を超えました。アクセスの観点では昨年比でやや訪問者数落ちちゃいましたね。実は3月くらいと9月くらいにそれぞれ何かがあったようで全体的なSEOが悪化しています。この調子で行くと来年はもう一段階下がりそうです。とはいえ延べ20万人以上の方にアクセスいただいているのでめげずに更新していこうと思います。

記事のまとめ

今年もよく読まれた記事ランキングを見ていきましょう。GA4なので、1年間のpage_viewイベントの数でランキングします。

  1. Pythonで日付の加算、特にnヶ月後やn年後の日付を求める方法 (昨年1位)
  2. PythonでBase64エンコードとデコード (昨年8位)
  3. matplotlibでグラフ枠から見た指定の位置にテキストを挿入する (昨年3位)
  4. matplotlibのdpiとfigsizeの正確な意味を調べてみた (昨年5位)
  5. M2搭載のMacBookにPython環境構築 (2023年02月時点) (New)
  6. matplotlibのグラフを高解像度で保存する (昨年2位)
  7. Pythonのリストをn個ずつに分割する (昨年4位)
  8. PythonでMeCabを動かそうとしたらmecabrcファイルが無いというエラーが出たので原因を調べた (昨年10位)
  9. globでサブフォルダを含めて再帰的にファイルを探索する (昨年7位)
  10. Pandasで欠損のある列の文字列型の数値を数値型に変換する (昨年9位)

新規でランクインした記事が1記事だけってのがちょっと寂しいですが昨年からの人気記事がそのまま今年もアクセスを集めていました。これらの記事は比較的ChatGPT等の生成AIへの質問で代用しやすいのかなとも思っており、このブログのアクセス低下の一因ともなっていそうです。

MeCabの小ネタなどは意外とChatGPTが詳しい情報を持ってなかったりするのでこの辺でアクセス集めれるといいのですがいかんせん元々ジャンルがマイナーですからね。そして自然言語処理の各技術自体がLLMに押されて関心を向けられなくなっているような気もします。

年初の目標の振り返り

一応、年初に目標立てていたのでその振り返りもやっておきます。
参考: 2023年のご挨拶

予定していた通り、統計数理研究所の講座を受講したり、すうがくぶんかや和からのイベントを聴講したりと仕事直結するもの以外の勉強にも色々時間をつかえた年になったと思います。

ブログ記事に関しては、生存分析とか、状態空間モデルとか、因果探索の記事書くぞ、みたいなことを書いていたのにこの辺の記事は全然書けていません。大変申し訳ない。ただ、年初に想定していなかった内容で書きたい内容が多く出てきたと言うことでもあり、一概に悪いことばかりでもないなと思っています。書けなかったテーマは来年に持ち越しです。

ブログのメンテやるぞ、って目標に関してはいよいよ管理画面が動かなくなるほどの事態に追い込まれての対応になりましたがリソース増やしたりPHPとWordpressのバージョン上げたりと対応を完遂できました。GAもUAからGA4に移行できていますし。ちゃんと計測していませんがもし、以前より快適にアクセスできるよになっていたら嬉しいです。

投資ツール開発の個人プロジェクトも進み、かなりスムーズに運用が回るようになっています。もうほとんどの作業がAWS環境に乗りました。一部、Excelマクロが生き残ってるので来年こそ完全AWS化をしたいです。

それ以外の出来事について

この2023年は個人的にはイベントが盛りだくさんの1年間でした。データ分析を担当した本が新しく出版された(これが2冊目)とか、データ提供した某ビジネス誌の記事に名前を載せてもらえたとか、分析結果が日経新聞の1面に載ったとか、勤め先が新規上場したとか、マーダーミステリー始めたとか新しいコミュニティーに参加するようになったとか本当に色々ありました。

その中でも一番大きいベントは転職と引越しです。

7月末で会社を辞めて8月から新しい会社に転職しました。職種はデータサイエンティストのままですが、業界は人材系から教育系に変わっています。

転職に伴い住居も引っ越しました。ただ、転職前後の会社が両方ともフルリーモートなのであんまり引っ越した意味はなかったですね。

新会社では情報発信に力を入れており、サービス開発部の各メンバーがnoteやQiita、Zennで記事書いていますので僕もその会社の社員としてのアカウントをnoteに作ってそちらでも記事を書き始めました。まだ数の面でも内容の面でも大した記事はないですが、このブログの一番下のリンクにひっそりと追加しています。

転職があったので、業務内容も扱う技術スタックも大幅に変わり、転職後は各種ツールやサービスの使い方、社内のデータ構造の把握等にインプットのリソースを大きく割いていました。その影響か、ただでさえtips的な内容で記事数を稼いでいたこのブログが一層内容が薄くなってた部分もあるかなぁと感じています。アクセス数停滞の1番の要因はこれかも。

転職から半年近く経ってようやく、教育工学等のドメイン知識の領域へ手を伸ばせる気配が出て来たのでこれからまた徐々に活動の幅を広げられたらいいなと思っています。今はまだ社内のデータチームが立ち上げ段階でほぼダッシュボード係&データ抽出屋さんって感じなので。

来年に向けて

来年以降のこのブログをどうするかはまた今週よく考えて決めておきたいと思います。

来年はnoteも書くのでなかなかこのままのペースは厳しいような気もしていまして。ただ、書きたいと思ってるのに書けてない記事ネタの山を見るとペースは維持したいような気もします。今週よく考えて年初の記事で目標宣言できたらと思います。

それではみなさま、今年も1年間ありがとうございました。また来年もよろしくお願いいたします。

当事者になって分かったストックオプションに関してあまり理解されていないと思ったこと

はじめに

今回の記事はストックオプションに関するものです。全く技術的な要素が無く普段の投稿と違うテイストの記事ですが、このブログの訪問者にはベンチャー企業に勤めてるかたが多いんじゃないか、つまり訪問者の方にとって何かしら有益な情報になるのではないかと思ってここに書きます。

個人的な話ですが、僕は株式に限っても10年以上トレードをやっており、さらに株式以外のFX等を含めると18年近くトレーダーをやっています。さらに初めてベンチャーに転職した頃にストックオプションとは?といった趣旨のWeb記事などをよく読んでいたのでそこそこ理解しているつもりでいました。しかしそれでも実際に前職でストックオプションを付与され無事に会社がIPOして行使できた過程の中で初めて理解したことがいくつかあったのでそれをまとめます。また、ついでに一般的なSOの説明記事等で取り上げられていない、特に新卒就職からずっとベンチャーで働いてる人たちにはあまり知られてないんじゃないかなって思ったことも書いていきます。

逆に、そもそもストックオプションとは何かとか上場とは何かみたいな話は書きませんのでその辺は世にたくさんある他の記事を参照してください。

免責事項

記事の内容は正確なものになるように努めますが、自分はストックオプションの専門家ではなく、1社で行使を経験しただけなのでこの記事の内容に基づいた判断や行動は自己責任でお願いします。本編の最初に書きますがストックオプションにはざっくり分けても多くの種類があり、各企業や主幹事証券会社の設計によって事情が変わりえます。疑問に思ったことはご自身の勤め先の担当者に確認してください。

参考にこの記事を書いている僕が経験したSOは無償SOで税制適格SOです。その他の種類のSOについては未経験なので、この記事では言及しません。また、主幹証券会社は野村證券でした。証券会社による差もあると思いますので注意してください。

それでは以下本文です。

1. ストックオプションには複数の種類があり、会社ごとにも細かい違いがある

これは比較的よく知られていることですね。最近信託SOというのも話題になっていますが、一口にストックオプションと言っても多くの種類が存在します。有償SOと無償SOや、税制適格SOとそうでないもの、信託型SOとそうでないものなど、ざっくり分けても複数種類があります。

さらに細かく言えば、ストックオプションは会社ごとに設計されるものであり、行使条件等が会社によって細々と違います。例えば在籍年数が一定を越えないと全部は行使できないとか退職後の行使を認めるかどうかとかの規約が会社によって違います。同じ会社であっても個人個人でロックアップの有無などが変わったりもします。

免責事項に書いたことの繰り返しですがご自身が付与されたSOの設計がどうなっているのかはよく確認する必要があります。

また、これらの事情から個々の会社ごとの差異を除いたSOの一般論として語れる内容には限界があり、世の中のSOに関する各記事に説明不十分な点が出てしまうのも仕方ないと思いました。

2. ストックオプションの権利行使と取得した株式の売却はそれぞれ別の手続き

世の中のWeb記事のざっくりとした解説では「ストックオプションとは決められたか価格で株を買う権利であり、その価格より株価が高い状態で行使すると差額分を利益として得られる。」と言った解説がされています。要するに「行使価格100円のSOを株価300円の時に行使したら一株当たり200円の利益を得られる」と言った趣旨のことが書いてあります。

これで僕は「SOを行使してその株を売る」という1個の手続きが存在するのかな、と勘違いしていました。要するに「SO行使します」と言ったら(行使価格と時価の差分)*(株数)の行使益みたいなものがポンと振り込まれるのかと思っていました。

実際は、行使は行使、売却は売却で別々の手続きです。まずSOを行使して株を買って、その後保有し続けるか売却するかという話になります。

3. ストックオプションを行使するときはお金を払う

2.の続きですね。行使と売却が同時にできず、まずSOを行使するだけという手続きがあるので当然の話ですが、株を買う権利を行使するならその購入費用を支払わないといけません。

自分が100万円分のSOを行使したいなら100万円払う必要がありますし、1000万円分のSOを行使したいなら1000万円、1億円分なら1億円を指定口座に振り込む必要があります。

これ読んで心配になった人もいるかと思いますが、SOの一部を行使して、その株を売って、それで得た資金でまたSOを行使して、と繰り返すことも可能なので自己資金がなくてSOが無駄になるってことはあまりないと思います。ただ、後に書きますが、株をなかなか売れない人もいるのでこの手段は全員がスムーズに使えるわけでは無いのでその点は注意です。

4. 税制適格ストックオプションは年間の行使額に上限がある

税制適格ストックオプションは税率が優遇される代わりに色々制限がつきますが、その中で社員が特に気にしないといけないのがこの点です。2023年時点では税制適格ストックオプションの年間の行使価格の上限が1200万円となっています。

もう少し細かくいうと、租税特別措置法 第29条の2というのがあって、「二 当該新株予約権の行使に係る権利行使価額の年間の合計額が、1200万円を超えないこと。」と定められています。

ただ、これは税制上の優遇を受けられる法律上の上限行使額が年間1200万ってことで、各企業ごとにうちは上限x万円までしか行使できないとか別途規約があったり、税制上の優遇がされなくていいならいくらでも行使していいとか個々に規定がある可能性もあるのでよく確認してください。

これが大きく影響するのは多額のSOを条件に招致される役員さん等でしょうね。

5. ストックオプションの行使には証券会社に専用口座が必要

これは主幹証券会社によって違うかもしれません。僕が経験したのが野村證券だけなのでそれを例に書きます。

実は、新卒で入った会社を辞める時に持株会の株を売るために野村證券の口座を作りました。その後は手数料が高いので使わず、解約手続きも電話が繋がらずできなかったのでただ放置していた口座でした。SOを付与された当時の勤め先の主幹証券会社が野村證券になった時にじゃあこの口座を使えるかと思っていたのですが、ストックオプションの取引にはストックオプション専用講座が必要ということになり野村證券に改めてもう一口座開設の手続きが必要でした。

一般的に自分が複数の証券会社に口座を持っている場合、口座間で株式の移管が行えるものなのですが、税制適格ストックオプションの税制上の優遇を受けるためには他の証券会社に移さず、この専用講座で売却する必要があります。

野村證券なので売却手数料は馬鹿みたいに高かったです。普段ネット証券を使っている方は驚くと思います。ただ逆にSOを行使して株式を購入する時は手数料はなく、純粋に行使価格と株数を掛けた金額をちょうどが支払い金額でした。この辺も主幹証券会社によって事情が変わると思います。

6. ストックオプションの行使には時間がかかる

これはタイトルそのままです。会社や主幹証券会社によって日数は少々変わると思いますが。SOを行使したい旨を会社に伝えて申請書をもらって書いて提出して承認してもらって行使資金の振込先口座を教えてもらってお金を振り込んでそこから手続きが進んで、自分の証券口座に株式が移されるという手順を順に踏んでいくことになり、1個1個の手順が数日がかりになります。

通常の株の購入みたいに今日買いたいと思ってもすぐできるものでは無いということです。

7. ストックオプションを行使して得た株は自由に売れるわけでは無い

これはストックオプションに限った話ではなく、上場企業社員の一般論です。通常は、上場企業の社員は自分が勤める会社の株を自由に売り買いできず、会社ごとに何かしらの規約があります。

また、IPO固有の事情としてはロックアップというものがあって、一部の大株主や役員は新規上場から一定期間該当株式の売買ができない取り決めになります。

僕はこのロックアップの対象外だったので上場直後から複数の知人から「ロックアップついてなかったから、もういつでも売れるんじゃ無いですか?売りました?」と言った趣旨のことを言われました。しかし、ロックアップがなかったからと言って自由には売れません。

これは本当に会社ごとに規約が違うので自社に確認するべきですが、売買できる期間が決まっていて売買を希望するなら事前に申請が必要とかそういう種類のルールがあると思います。非上場企業の場合、現時点でルールがなかったとしてもおそらくIPOする時にこの種のルールが作られると思います。

また、退職したとしても一定期間はその企業の関係者扱いになります。これが法律で決まってるのか各企業の自主的な規制なのかと言った詳しいことは知りませんが、自分が新卒時就職した上場企業も退職後1年間は証券口座上で関係者扱いだったのでおそらく一般的なルールなのでしょう。

8. 実はストックオプションはノーリスクでは無い

ここまでに買いた2, 6, 7 の組み合わせから導かれる結論がこれです。なんか世の中には株価が下がったらストックオプションを行使しなければいいだけだからノーリスクだという主張をする記事があります。実は僕はそれを信じていたので2.の行使と売却が同時にできるのではという勘違いをしていました。

ストックオプションの行使と株式の売却が別の手続きで、それぞれがタイムリーに行えない以上、ストックオプションを行使してから売るまでに株価が行使価格を下回って損をするリスクはあります。また、行使だけに限ってももう取り消しできないという段階で株価が暴落し、市場価格より高い金額で購入することになるリスクはあります。

9. ストックオプションの保有状況はIPO時に公表される

実は当事者になって一番びっくりしたのがこれです。日本取引所グループのサイトに新規上場企業の情報がまとまったページがあります。ここのPDFを見ていくと各企業の株主の情報が載っているのですが、現物株を持ってる人だけでなくストックオプションの保有者も公開されます。公開されるのは氏名と住所(市や区まで)と株数ですね。

参考: 新規上場会社情報 | 日本取引所グループ

7. で知人にばれた元ネタはこれと、これを転載したIPO情報サイトです。

10. ストックオプション専用口座で発生する利益にかかる税金は源泉徴収では無い

これはもしかしたら証券会社によって違うかもしれません。少なくとも僕が使っているところでは特定口座と扱いが異なり、売却益からはまだ税金が取られていないので時期が来たら確定申告して自分で納税することになります。これ自体は今後やることなのでこれ以上語れることはありません。

11. なかなか株を売れない人もいるらしい

これは自分はそうではなかったので伝聞だけの話です。会社の中でも特に要職にある人はそう気軽に株式を売却できないらしいですね。こうなると3. で書いたテクニックのSOを行使してその株の売却資金で次のSOを行使するって手段が使えなくなります。

また、7. の上場企業の従業員は自由に売買できないって話にもつながりますが、インサイダー情報を知ってる人という扱いになると売買を申請しても却下される可能性があるとも聞きました。

これは会社だけでなく個人個人によって状況が大きく異なる点なので各自がよく確認してください。

12. 売却時期の判断は難しい

これはただの感想。実際難しいです。個人的にはちょっとしくじったと思ってますがもう仕方ないですね。個人投資家としてのキャリアの中でもこんな大きなポジションを持ったことはなかったですし、さらに自分は新規上場株を扱ってこなかったので、これまでの取引経験が活かせたような実感はありませんでした。

まとめ

株取引をやっているので自分は詳しい方だと思っていましたが、それでもストックオプションに関して誤解していることが複数ありました。人生でそう何度も経験することではなく、当事者のほとんどが情報不足で直面するわりにインパクトが大きいことなので、この記事が訪問者の方々のキャリアの中でなにかしらお役に立てれば幸いです。

免責事項の中で書いたことの繰り返しになりますが僕自身も1回経験しただけで、ストックオプションは他にも種類があるため、他の種類のストックオプションにはそれはそれで固有の事情があると思います。ベンチャーで働く皆様におかれましては各社の制度をよく理解し良いベンチャーライフをお送りください。

2023年のご挨拶

新年明けましておめでとうございます。本年もこのブログをよろしくお願いします。

早速ですが今年のこのブログの更新方針を決めました。昨年同様に今年もしっかりインプットの時間を確保し、ブログへのアウトプットは少なめに週1回の更新を目指していきたいと思っています。

今年は新年早々から統計数理研究所の講座受講も2件決まっていたり、参加したいセミナーやミートアップも既にいくつかあるので積極的に動いていきたいです。昨年からすうがくぶんか社のセミナーも受講していますが、今年も何か面白そうなのを探して受講しようと思います。また、書籍についても昨年後半出た本が複数あり、まだ追いついていないので順次読んでいきます。

昨年はインプットを増やすと言って一番増えたのがビジネス系Youtubeの視聴時間だったので、今年はちゃんと読書時間を増やしたいです。Youtubeは最初は良かったのですが、冷静に見ると似たようなネタの繰り返しが多くてそろそろ減らしていいかなと思ってます。

このブログはネタ帳を用意していてそこに常時数十個のテーマを列挙しており、そこからその日の気分でピックアップして書いています。大体その執筆時点で新しく知ったばかりのことを優先的に選んで書いてるのですが、そうやって場当たり的に書いていると、タイミングを逸していつか書きたいと思ったまま放置状態になってしまっているテーマがたくさん残ってしまいました。この点は反省していて、そのうち書こうと思っていたけど放置してた系の記事をもっと書くようにしたいなと思っています。

例えば以下のような内容がいつか書かねばと思って放置された状態です。物によってはブログ開設前(2018年)にリストアップしてその時からずっと放置しています。全部書けるかというと難しそうなのですが少なくとも半分程度はクリアしたい。
– グラフのコミュニティー検出
– AWSの各サービスについて(DynamoDB/ personalize/ Forecast/ SageMaker など)
– opencv
– 生存分析(カプラン・マイヤー法やCOX回帰など)
– node2vec
– scikit-learn等のライブラリの最近の新機能
– 因果探索(LiNGAMなど)/因果推論
– 時系列データの異常検知や変化検知
– 状態空間モデル(カルマンフィルター)
– JavaScriptのデータ可視化関数(特にワードクラウド)
– Word Mover’s Distance などの自然言語処理の小ネタ
– jupyter lab
– J-Quants API
その他、numpy, scipy, pandas, matplotlib, tableauなどの小ネタなどが多数。

今年は今年で新ネタは出ると思いますし、更新回数が50回程度と考えるともう1年分のネタは確実に確保できそうです。あとは実際に執筆する時間とモチベーションを維持できるかという点が問題ですね。(何せ、書ける状態なのに書かなかったネタたちなので1つ1つがちょっと重い。)
できる範囲で頑張って書いていこうと思いますのでよろしくお願いします。

この他、昨年目標に入れていてあまり手をつけなかったこのブログ自体のメンテナンスもやらなければなりません。PHPやバージョンアップとか。これLightsail使ってるとすごく面倒なんですよね。
また、この記事を書いてる時点で海外から攻撃を受けているようでして、どこかの誰かが執拗にLoginを試みていてそのアクセスでCPUリソースが枯渇しているようです。
ここがそんなハッキングする価値のあるブログだとは思えなのですが、攻撃してくる人がいる以上はセキュリティ面の強化等も進めなければなりませんので、何かやったら記事にしていこうと思います。
アクセスが重くなっていることがあり、訪問者の方にはご不便をおかけします。

訪問者の方にはあまり関係ないことなのですが、Google Analyticsの旧バージョン、ユニバーサル アナリティクスが今年終了するというのもブログ関係では大きなイベントですね。
後継のGA4をしっかり学んで、継続して分析ができるようにしたいと思います。
(ただ、現時点のGA4は明らかにUAに劣るように感じているので、他の分析ツールへの乗り換えも視野に入れたい。これから改善するといいのですが。)

ブログ以外では、昨年からやっている投資ツール開発の個人プロジェクトももっと進めていきます。プログラムはほぼ動くものが揃ってきているのであとは手動で実行から自動実行への切り替えとか自動実行に伴うエラー通知の仕組み構築とかが残課題です。

以上のような方針で今年も頑張っていこうと思いますので、本年もよろしくお願いいたします。

2022年のまとめ

今日は2022年最後の月曜なので、この記事が2022年最後の記事です。1年間毎週の更新を継続できてほっとしています。

今年は年初に書いた方針通り、昨年に比べて更新頻度を半分に落としました。しかしそれでも昨年以上に多くの方に訪問していただけました。昨年も書いていますが、休日も夜間も継続的にアクセスがあり、いつも自分以外にも、どこかで技術的な調査や勉強に取り組んでいる人がいると実感できることは自分自身にとっても励みになりました。また、TwitterなどのSNSや他のブログ等で引用されていることを見かけることも多く、自分が書いた記事が誰かの役に立っていると実感でき、そのおかげでアウトプットを続けてくることができました。

まとめの記事なので、今年も1年間の振り返りをやります。本年までの累積の記事数および、年間のアクセス数は次のようになりました。

– 累計記事数 566記事 (この記事含む。昨年時点 514記事)
– 訪問ユーザー数 272,075人 (昨年実績 200,661人)
– ページビュー 476,587回 (昨年実績 348,595回)

更新数落として昨年比で+33%の訪問者数というのは本当に嬉しいです。最近では平日は1日1800人ものかたに訪問していただいています。

現行のGoogleアナリティクス(UA)が来年6月まででサービス終了してしまうので、来年はこの集計をどうするか考えないといけないですね。

今年もよく読まれた記事ランキングを見ていきましょう。以前は半年おきにやっていたのですが、今年は更新数を減らしたのもあって上期にやらなかったので1年ぶりです。
2022年1年間でのPV数によるランキングは次のようになりました。

1. Pythonで日付の加算、特にnヶ月後やn年後の日付を求める方法 (New)
2. matplotlibのグラフを高解像度で保存する (昨年1位)
3. matplotlibでグラフ枠から見た指定の位置にテキストを挿入する (昨年8位)
4. Pythonのリストをn個ずつに分割する (New)
5. matplotlibのdpiとfigsizeの正確な意味を調べてみた (New)
6. Pythonで連続した日付のリストを作る (昨年3位)
7. globでサブフォルダを含めて再帰的にファイルを探索する (New)
8. PythonでBase64エンコードとデコード (New)
9. Pandasで欠損のある列の文字列型の数値を数値型に変換する (New)
10. PythonでMeCabを動かそうとしたらmecabrc ファイルが無いというエラーが出たので原因を調べた (New)

今年新規にランクインした記事が7記事となりました。matplotlibのグラフの解像度を設定する話は長いことこのブログの一番人気だったのですがついに入れ替わりましたね。(データサイエンス要素は薄いのでこれが人気というのは若干複雑な気持ちです。)
ただこの中で、今年書いた記事って10位のmecabrcの記事だけのような。まぁ、古い記事が強いというのは長期にわたってニーズがある記事を書けているということでもあるので、今年書いた記事たちも来年以降に期待しましょう。

1年間の終わりなので、年初に立てた方針の振り返りもやっておきます。
参考: 2022年のご挨拶と今年の方針

まず、アウトプットは減らしてDSに限らず幅広い範囲のインプットを重視したいという話については、ある程度達成できたが、思っていたのとは違う形になったというのが正直なところです。データ分析の分野では、有償の講座受講などを増やし今までと違った形での学習機会を得ることができました。また、データサイエンス系の書籍の読書量は減らしたとはいえゼロにはしておらず、一定量の継続もできています。

また、仕事に関係ないところでもいつか読みたいと思っていた漫画のシリーズをいくつも読破できましたし、都内各地のいつか行ってみたいと思っていたところへ観光に行くこともできました。特に、上野の国立科学博物館は行ってよかったですね。次は特別展も見てみたいです。

若干想定外だったのは、今年1年間、Youtubeの視聴時間が急激に伸びたことです。人材業界で働いているので転職や就職などのキャリア関係のチャンネルをよく見ました。他にもエンジニア教育、数学を中心とした科学など幅広く見ています。近年Youtuberが増えて配信してる人は収益化が大変だという話を耳にしますが、視聴者としては良質なコンテンツも増えており大変勉強になります。書籍に比べてダラダラ見ることもできるのもいいですね。これは年初は全く想定してなかった変化でしたが良い結果になったかなと思います。

一方で、Youtubeの視聴時間の増加の割をくった形になったのが、データサイエンス以外の分野のビジネス書を読む時間で、これは計画の半分くらいしか進まなかったなと思います。来年改めて取り組みたいです。

このブログ自体のメンテナスをやるぞ、という目標もあったのですがこれが全然進みませんでした。リンクやカテゴリの見直しなどはまだいいとして、PHPのバージョンが古いとか流石に放置しておくのは良くない問題も出ているのでこれは来年対応したいです。

目標には入っていませんでしたが、今年やった取り組みとしてGithubにプライベートリポジトリを立てて、自分一人のプロジェクトを始めたというのもあります。実は17年ほど投資をやっていてExcel VBAで自作したツール群を使っていたのですが、これらをAWSとPythonで書き直していきました。いつかAWSに移行したいと7年くらい前から思ってたのになかなか着手できなかったプロジェクトを進めることができたのは自分にとっては大きかったです。このプロジェクトはこれからも続けていきたいですね。

来年のこのブログをどうするかは、仕事以外も含めて一通り目標を立ててその中でしっかり決めていきたいと思います。来年は2日かその翌週9日かが最初の記事になると思いますが、それまでに方針固めます。

それではみなさま、今年も1年間ありがとうございました。また来年もよろしくお願いいたします。

2022年のご挨拶と今年の方針

新年明けましておめでとうございます。本年もよろしくお願いします。

さて、今年のこのブログの更新方針について決めたのでまとめておきます。
昨年末の記事でも少し頭出ししていましたが、ブログに限らず今年の計画や目標について考え、今年1年はアウトプットよりもインプットを重視した年にしようと決めました。また、その内容もデータサイエンス関連に限らず幅広く吸収していく年にしたいです。

アウトプットの時間は減らしたいのとインプット内容にこのブログ記事につながるようなテーマの物が減るということで、このブログの更新ペースは落とします。昨年の半分くらいにして週1回更新、年間50記事程度を目標にゆっくりやっていこうと思います。もし書きたいことがありすぎて困るようなことになったらまたその時にペースを見直すかもしれませんが。

僕はもともと読書が好きで色々なジャンルの本を幅広く読んでいました。その後、2017年に転職してデータサイエンティストになってからこの5年ほどの期間、まずは仕事で使うデータ分析のスキルを優先しようということで読む本がほとんど広い意味でのデータサイエンス関連や、ドメイン知識としての人材業界関連の本ばかりになっていました。特にそれが不満というわけでもなく、どんどん新しい知識が身に付き、できることが増えていくことにやりがいも感じていました。この分野は本当に学ぶことが多く、この先も興味が尽きることはなさそうです。ただその一方で、趣味に関する本とか書店でたまたま見かけて興味を持った本とか話題のベストセラー等々の他の読みたい本を読むのが完全に後回しになってきたのも事実です。

今年もデータ分析の勉強は継続はしますし、今の時点で絶対読みたいと思ってる本はそこそこあるのですがが、それらを読むのは月に1〜2冊程度に抑えようと思ってます。そして浮いた時間はまた昔みたいに、仕事や実用性を無視して興味を持ったものを何でも読んでいく時間にします。

その他、流石に3年も運用しているとこのブログにも色々改善したい点あったり、内容が古くなってしまった記事などもあります。新規の記事を書く時間を減らした範囲内で、過去記事の見直しなどを含めたメンテナンスにも細々と着手しようと思います。例えば「プログラミング」っていう非常に雑なカテゴリに多くの記事が集中してしまっているのでこの辺の見直しもしたいです。

以上のような方針のためこのブログの更新は昨年に比べてゆっくりになりますが、本年もよろしくお願いいたします。

2021年のまとめ

2021年の最後の投稿になります。

本年も訪問者の皆様には大変お世話になりました。書いた記事が多くの方に読んでいただけたということはもちろんですが、土日祝日なども平日より少ないとはいえ多くのアクセスがあり、休日も技術的な調べ物をしている熱心な人たちがいると実感できることは自分が学習を続けていく上でも大きな励みになりました。

今年も1年間の振り返りをやっていきたいと思います。本年までの累積の記事数および、年間のアクセス数は次のようになりました。
– 累計記事数 514記事 (この記事含む。昨年時点 409記事)
– 訪問ユーザー数 200,661人 (昨年実績 146,674人)
– ページビュー 348,595回 (昨年実績 258,698回)

年間100記事更新の目標を無事に達成でき、それに伴って訪問者の数も増えているので達成感を感じています。

とはいえ、多くのpvを集めているのは古い記事が多く、今年特に力を入れて書いたMeCabのアルゴリズムの話や、AWSのAI関連サービスの話、トレジャーデータの小ネタなどはあまり読まれていないようです。テーマ選びなのか僕の文章力なのか、なんらかの課題はあるように感じています。

さて、恒例のよく読まれた記事ランキングを見ていきましょう。
今回は2021年1年間でのPV数によるランキングです。

  1. matplotlibのグラフを高解像度で保存する (昨年1位)
  2. ネットワークグラフの中心性 (New)
  3. Pythonで連続した日付のリストを作る (New)
  4. pyenvで作成した環境を消す (New)
  5. TensorflowやKerasでJupyterカーネルが落ちるようになってしまった場合の対応 (New)
  6. numpyのpercentile関数の仕様を確認する (昨年4位)
  7. INSERT文でWITH句を使う (昨年7位)
  8. matplotlibでグラフ枠から見た指定の位置にテキストを挿入する (New)
  9. kerasのto_categoricalを使ってみる (昨年3位)
  10. Pythonで多変量正規分布に従う乱数を生成する (昨年10位)

Googleアナリティクスで確認した時、1位と10位が昨年と同じなので今年もあまり変わり映えしないなという印象を持っていました。しかし、改めて昨年のランキングと比較してみると昨年ランクインしなかった記事が5記事も入っており意外と顔ぶれ変わってましたね。

このブログもこれで開設から丸三年になります。流石にネタ切れを感じる日もあるので来年の運用をどうしようかと考えています。(とはいえ、ブログネタのストックは今時点で40個程度はあるので本当の意味ではネタ切れしてないのですが、書きたいけどなかなか筆が進まないものやタイミングを逃した感があるのも多く難しいところです。)

来年も技術的なスキルアップを目指した学習はもちろん続けていきますし、仕事の中での疑問や課題感からネタが出てくることもあると思うので、ブログの更新自体は続けていきます。ただ、技術関連以外のインプットにももっと力を入れていきたいですし、休日の時間を今以上に読書や講座受講などに使いたいので、更新頻度は見直したほうがいいかもとは思っています。

この年末年始で来年をどう過ごすかを考えて、その中でブログの運用方針も決めたいと思います。

それではみなさん、今年も1年間ありがとうございました。良いお年を。

勤務先のテックブログの宣伝

現在、週2回のペースでこの(私用の)ブログを更新していますが、実はここ以外にも勤務先であるオープンワーク社のテックブログにも記事を投稿しています。
投稿頻度はこのブログに比べて非常に低く、僕はまだ4記事しか投稿していないのですが、
その分、1記事1記事は丁寧に時間をかけて書いてきました。

こちらのブログには書いてこなかった、実際に仕事でやっている内容と密接した記事も書いていますので、
もしご興味のあるかたがいらっしゃいましたらこれらの記事も読んでいただけると嬉しいです。

僕が投稿した記事は以下の4記事になります(新しい順。)

OpenWorkの年齢別年収機能の裏側
ABテストの目的と分析時にアナリストが考えていること
企業の”採用力”を指標化しようとして失敗した話
オープンワークのアナリストが分析していること

次の更新は未定ですが、また新しい記事を更新したらこちらのブログでも紹介させていただこうと思います。

追記
転職するため2023年7月末で退職いたしました。

2021年上半期(1月~6月)によく読まれた記事

2021年もあっという間に半分が終わってしまいました。
ここで恒例(?)のよく読まれた記事ランキングを掲載したいと思います。

参考ですが、昨年1年間のよく読まれた記事ランキングはこちらです。
参考: 2020年のまとめ

では早速発表していきます。
集計期間は2021年1月から6月まで。pvでソートしています。

  1. matplotlibのグラフを高解像度で保存する
  2. ネットワークグラフの中心性
  3. pyenvで作成した環境を消す
  4. TensorflowやKerasでJupyterカーネルが落ちるようになってしまった場合の対応
  5. Pythonで連続した日付のリストを作る
  6. numpyのpercentile関数の仕様を確認する
  7. matplotlibのデフォルトのフォントを変更する
  8. INSERT文でWITH句を使う
  9. kerasのto_categoricalを使ってみる
  10. scipyで階層的クラスタリング

相変わらず、プログラミングのちょっとした小ネタのような記事が人気を集めていますね。
このブログ自体そういう記事が多いので、やむを得ないことですが。

データサイエンティストのブログらしい記事としては、
今回ネットワークグラフの中心性の記事が2位にランクインしました。
これを書いたのは昨年なのですが、当時ネットワーク解析について色々勉強して書いた記事だったので、
ニーズがあって嬉しいです。