Pythonで文字列のリスト(配列)と数値のリストを相互に変換
Pythonで文字列str
のリスト(配列)と数値int
, float
のリストを相互に変換する方法について、サンプルコードとともに説明する。
リストから新たなリストを生成する場合はリスト内包表記を使うとforループよりもシンプルに書ける。本記事のサンプルコードでもリスト内包表記を使っている。
- 関連記事: Pythonリスト内包表記の使い方
文字列から数値への変換について、全角アラビア数字や漢数字からの変換などのより細かい内容は以下の記事を参照。
なお、リストは異なる型のデータを格納可能で、厳密には配列とは異なる。配列を扱いたい場合はarray(標準ライブラリ)やNumPyを使う。
数値のリストを文字列のリストに変換
数値を10進数の文字列に変換
数値から文字列への変換はstr()
を使う。
Pythonでは数値を指数表記や16進数、2進数(16進表記、2進表記)など様々な形式で表現できるが、str()
で変換した場合は通常の10進表記の文字列となる。
桁数によっては自動的に指数表記となる場合もある。
l_n = [-0.5, 0, 1.0, 100, 1.2e-2, 0xff, 0b11]
l_n_str = [str(n) for n in l_n]
print(l_n_str)
# ['-0.5', '0', '1.0', '100', '0.012', '255', '3']
数値を2進数、8進数、16進数の文字列に変換
2進数、8進数、16進数(2進表記、8進表記、16進表記)の文字列に変換するには、bin()
やoct()
, hex()
関数を使うか、format()
関数(または文字列str
のformat()
メソッド)を使う。
format()
関数だと0埋めして桁を合わせたりできる。
l_i = [0, 64, 128, 192, 256]
l_i_hex1 = [hex(i) for i in l_i]
print(l_i_hex1)
# ['0x0', '0x40', '0x80', '0xc0', '0x100']
l_i_hex2 = [format(i, '04x') for i in l_i]
print(l_i_hex2)
# ['0000', '0040', '0080', '00c0', '0100']
l_i_hex3 = [format(i, '#06x') for i in l_i]
print(l_i_hex3)
# ['0x0000', '0x0040', '0x0080', '0x00c0', '0x0100']
数値を指数表記の文字列に変換
上述のように、桁数によって自動的に指数表記になる場合もあるが、常に指数表記の文字列に変換するには、format()
関数(または文字列str
のformat()
メソッド)を使う。
format()
関数、文字列メソッドstr.format()
についての詳細は以下の記事を参照。
仮数部の桁数を指定できる。なお引数に大文字のE
を使うと、出力文字列も大文字のE
となる。
l_f = [0.0001, 123.456, 123400000]
l_f_e1 = [format(f, 'e') for f in l_f]
print(l_f_e1)
# ['1.000000e-04', '1.234560e+02', '1.234000e+08']
l_f_e2 = [format(f, '.3E') for f in l_f]
print(l_f_e2)
# ['1.000E-04', '1.235E+02', '1.234E+08']
文字列のリストを数値のリストに変換
10進数の文字列を数値に変換
文字列から数値への変換はint()
またはfloat()
を使う。int()
は整数int
型への変換、float()
は浮動小数点数float
型への変換となる。
float()
では、整数部が省略された文字列は整数部に0
が補完される。
l_si = ['-10', '0', '100']
l_si_i = [int(s) for s in l_si]
print(l_si_i)
# [-10, 0, 100]
l_sf = ['.123', '1.23', '123']
l_sf_f = [float(s) for s in l_sf]
print(l_sf_f)
# [0.123, 1.23, 123.0]
2進数、8進数、16進数の文字列を数値に変換
int()
の第二引数には基数を指定できる。2
なら2進数、8
なら8進数、16
なら16進数として文字列を数値に変換する。
0
を指定すると、0b
や0o
, 0x
(または0B
, 0O
, 0X
)のプレフィックスが付いた文字列をそれぞれ2進数、8進数、16進数(2進表記、8進表記、16進表記)として整数に変換する。
l_sb = ['0011', '0101', '1111']
l_sb_i = [int(s, 2) for s in l_sb]
print(l_sb_i)
# [3, 5, 15]
l_sbox = ['100', '0b100', '0o77', '0xff']
l_sbox_i = [int(s, 0) for s in l_sbox]
print(l_sbox_i)
# [100, 4, 63, 255]
指数表記の文字列を数値に変換
指数表記の文字列は特別な指定をする必要なくfloat()
でそのまま変換できる。
l_se = ['1.23e3', '0.123e-1', '123']
l_se_f = [float(s) for s in l_se]
print(l_se_f)
# [1230.0, 0.0123, 123.0]
数値に変換できる文字列のみ変換
数値に変換できない文字列をint()
やfloat()
に渡すとエラーValueError
になる。
エラー時にFalse
を返す関数を新たに定義すると、変換できる要素のみ数値に変換してリストの要素とすることができる。
def is_int(s):
try:
int(s)
except ValueError:
return False
else:
return True
def is_float(s):
try:
float(s)
except ValueError:
return False
else:
return True
l_multi = ['-100', '100', '1.23', '1.23e2', 'one']
l_multi_i = [int(s) for s in l_multi if is_int(s)]
print(l_multi_i)
# [-100, 100]
l_multi_f = [float(s) for s in l_multi if is_float(s)]
print(l_multi_f)
# [-100.0, 100.0, 1.23, 123.0]
try ... except ...
による例外処理については以下の記事を参照。