業務でMD5を使って文字列をハッシュ化する機会があったのでそのメモです。
(最近ではMD5自体があまり安全では無く、暗号学的な強度が必要なときは使うべきでは無いのでご注意ください。)
python3では、標準ライブラリにhashlibというものがあり、これにMD5が実装されています。
ドキュメント: hashlib — セキュアハッシュおよびメッセージダイジェスト
使い方は簡単で、インポートして hashlib.md5(“text”) するだけです、
となれば楽なのですが、これでは動きません。こんなふうにエラーになります。
import hashlib
hashlib.md5("text")
# 以下出力
TypeError Traceback (most recent call last)
in ()
----> 1 hashlib.md5("text")
TypeError: Unicode-objects must be encoded before hashing
これは、bytes型でデータを渡す必要があるからです。
そのため、b"text"
か"text".encode("utf-8")
のようにする必要があります。
これで一応エラーは無くなりますが、まだ少し不十分です。
というのも、戻り値がHASH object という型で返ってきます。
import hashlib
text = "Hello, World!"
bytes_text = text.encode("utf-8")
print(hashlib.md5(bytes_text))
# 出力
<md5 HASH object @ 0x10e3f7620>
欲しいのは、 16進法で表記された文字列だと思うので、もう一手間かけて、hexdigest
という関数を実行します。
import hashlib
text = "Hello, World!"
bytes_text = text.encode("utf-8")
hash_obj = hashlib.md5(bytes_text)
print(hash_obj.hexdigest())
# 出力
65a8e27d8879283831b664bd8b7f0ad4
# 1行でやる方法
print(hashlib.md5(b"Hello, World!").hexdigest())
# 出力は同じ
65a8e27d8879283831b664bd8b7f0ad4
これでできました。
sha1やsha256もhashlibに実装されているので同じように使えます。