【PowerShell】ソースコードファイル種による文字化けと文字コード

成否の評価について
- はリテラル文字または変数・関数名に2バイト文字が含まれている時点で構文エラーになる
× はターミナル出力時に文字化けする


Write-Output(ehco,write)

ターミナル ソースコードファイル 成否
PowerShell Shift-Jis
PowerShell UTF-8 -
PowerShell UTF-8BOM
pwsh Shift-Jis ×
pwsh UTF-8
pwsh UTF-8BOM


変数(文字列)から出力

ターミナル ソースコードファイル 成否
PowerShell Shift-Jis
PowerShell UTF-8 -
PowerShell UTF-8BOM
pwsh Shift-Jis ×
pwsh UTF-8
pwsh UTF-8BOM


データファイルの文字化け

Get-Content(gc)

ターミナル ソースコードファイル データファイル 成否
PowerShell Shift-Jis Shift-JIs
PowerShell Shift-Jis UTF-8 ×
PowerShell Shift-Jis UTF-8BOM
PowerShell UTF-8 Shift-JIs -
PowerShell UTF-8 UTF-8 -
PowerShell UTF-8 UTF-8BOM -
PowerShell UTF-8BOM Shift-JIs
PowerShell UTF-8BOM UTF-8 ×
PowerShell UTF-8BOM UTF-8BOM
pwsh Shift-Jis Shift-Jis ×
pwsh Shift-Jis UTF-8
pwsh Shift-Jis UTF-8BOM
pwsh UTF-8 Shift-Jis ×
pwsh UTF-8 UTF-8
pwsh UTF-8 UTF-8BOM
pwsh UTF-8BOM Shift-Jis ×
pwsh UTF-8BOM UTF-8
pwsh UTF-8BOM UTF-8BOM


OutputEncoding.EncodingName

デフォルトの出力時のエンコード

ターミナル ソースコードファイル Encode
PowerShell Shift-Jis US-ASCII
PowerShell UTF-8 US-ASCII
PowerShell UTF-8BOM US-ASCII
pwsh Shift-Jis UTF-8
pwsh UTF-8 UTF-8
pwsh UTF-8BOM UTF-8


[console]::OutputEncoding

デフォルトのコンソール出力時のエンコード

ターミナル ソースコードファイル Encode
PowerShell Shift-Jis 日本語 (シフト JIS)
PowerShell UTF-8 日本語 (シフト JIS)
PowerShell UTF-8BOM 日本語 (シフト JIS)
pwsh Shift-Jis Japanese (Shift-JIS)
pwsh UTF-8 Japanese (Shift-JIS)
pwsh UTF-8BOM Japanese (Shift-JIS)


リダイレクト[>,>>]

リダイレクトでファイル出力時の出力文字エンコード

ターミナル ソースコードファイル Encode
PowerShell Shift-Jis UTF-16LE
PowerShell UTF-8 -
PowerShell UTF-8BOM UTF-16LE
pwsh Shift-Jis ×
pwsh UTF-8 UTF-8
pwsh UTF-8BOM UTF-8



Encodingパラメーターがあるコマンドレット

ソースモジュール コマンドレット
Microsoft.PowerShell.Management Add-Content
Microsoft.PowerShell.Management Get-Content
Microsoft.PowerShell.Management Set-Content
Microsoft.PowerShell.Utility Export-Clixml
Microsoft.PowerShell.Utility Export-Csv
Microsoft.PowerShell.Utility Export-PSSession
Microsoft.PowerShell.Utility Format-Hex
Microsoft.PowerShell.Utility Import-Csv
Microsoft.PowerShell.Utility Out-File
Microsoft.PowerShell.Utility Select-String
Microsoft.PowerShell.Utility Send-MailMessage


Encoding パラメーター

上記コマンドレットのEncodingパラメータに指定できる値です
UTF-8についてはPowerShellとpwshでは意味が異なります
PwoerShellではBOM付きUTF-8ですがpwshではBOM無しUTF-8であることに注意してください


Version パラメーター 説明
PowerShell Ascii Uses Ascii (7-bit) character set.
PowerShell BigEndianUnicode Uses UTF-16 with the big-endian byte order.
PowerShell BigEndianUTF32 Uses UTF-32 with the big-endian byte order.
PowerShell Byte Encodes a set of characters into a sequence of bytes.
PowerShell Default Uses the encoding that corresponds to the system's active code page (usually ANSI).
PowerShell Oem Uses the encoding that corresponds to the system's current OEM code page.
PowerShell String Same as Unicode.
PowerShell Unicode Uses UTF-16 with the little-endian byte order.
PowerShell Unknown Same as Unicode.
PowerShell UTF32 Uses UTF-32 with the little-endian byte order.
PowerShell UTF7 Uses UTF-7.
PowerShell UTF8 Uses UTF-8 (with BOM).
pwsh ascii Uses the encoding for the ASCII (7-bit) character set.
pwsh bigendianunicode Encodes in UTF-16 format using the big-endian byte order.
pwsh oem Uses the default encoding for MS-DOS and console programs.
pwsh unicode Encodes in UTF-16 format using the little-endian byte order.
pwsh utf7 Encodes in UTF-7 format.
pwsh utf8 Encodes in UTF-8 format (no BOM).
pwsh utf8BOM Encodes in UTF-8 format with Byte Order Mark (BOM)
pwsh utf8NoBOM Encodes in UTF-8 format without Byte Order Mark (BOM)
pwsh utf32 Encodes in UTF-32 format.


上記パラメーターの他にPowerShell6.2より.NET Coreまたは.NET Frameworkで規定されているコードページIDまたはコードページ名が使用できます


.NET Coreで規定されているもの

コードページID コードページ名 表示名
1200 utf-16 Unicode
1201 utf-16BE Unicode (Big-Endian)
12000 utf-32 Unicode (UTF-32)
12001 utf-32BE Unicode (UTF-32 Big-Endian)
20127 us-ascii US-ASCII
28591 iso-8859-1 Western European (ISO)
65000 utf-7 Unicode (UTF-7)
65001 utf-8 Unicode (UTF-8)


.NET Frameworkで規定されているもの

コードページID コードページ名 表示名
37 IBM037 IBM EBCDIC (US-Canada)
437 IBM437 OEM United States
500 IBM500 IBM EBCDIC (International)
708 ASMO-708 Arabic (ASMO 708)
720 DOS-720 Arabic (DOS)
737 ibm737 Greek (DOS)
775 ibm775 Baltic (DOS)
850 ibm850 Western European (DOS)
852 ibm852 Central European (DOS)
855 IBM855 OEM Cyrillic
857 ibm857 Turkish (DOS)
858 IBM00858 OEM Multilingual Latin I
860 IBM860 Portuguese (DOS)
861 ibm861 Icelandic (DOS)
862 DOS-862 Hebrew (DOS)
863 IBM863 French Canadian (DOS)
864 IBM864 Arabic (864)
865 IBM865 Nordic (DOS)
866 cp866 Cyrillic (DOS)
869 ibm869 Greek, Modern (DOS)
870 IBM870 IBM EBCDIC (Multilingual Latin-2)
874 windows-874 Thai (Windows)
875 cp875 IBM EBCDIC (Greek Modern)
932 shift_jis Japanese (Shift-JIS)
936 gb2312 Chinese Simplified (GB2312)
949 ks_c_5601-1987 Korean
950 big5 Chinese Traditional (Big5)
1026 IBM1026 IBM EBCDIC (Turkish Latin-5)
1047 IBM01047 IBM Latin-1
1140 IBM01140 IBM EBCDIC (US-Canada-Euro)
1141 IBM01141 IBM EBCDIC (Germany-Euro)
1142 IBM01142 IBM EBCDIC (Denmark-Norway-Euro)
1143 IBM01143 IBM EBCDIC (Finland-Sweden-Euro)
1144 IBM01144 IBM EBCDIC (Italy-Euro)
1145 IBM01145 IBM EBCDIC (Spain-Euro)
1146 IBM01146 IBM EBCDIC (UK-Euro)
1147 IBM01147 IBM EBCDIC (France-Euro)
1148 IBM01148 IBM EBCDIC (International-Euro)
1149 IBM01149 IBM EBCDIC (Icelandic-Euro)
1200 utf-16 Unicode
1201 utf-16BE Unicode (Big-Endian)
1250 windows-1250 Central European (Windows)
1251 windows-1251 Cyrillic (Windows)
1252 Windows-1252 Western European (Windows)
1253 windows-1253 Greek (Windows)
1254 windows-1254 Turkish (Windows)
1255 windows-1255 Hebrew (Windows)
1256 windows-1256 Arabic (Windows)
1257 windows-1257 Baltic (Windows)
1258 windows-1258 Vietnamese (Windows)
1361 Johab Korean (Johab)
10000 macintosh Western European (Mac)
10001 x-mac-japanese Japanese (Mac)
10002 x-mac-chinesetrad Chinese Traditional (Mac)
10003 x-mac-korean Korean (Mac)
10004 x-mac-arabic Arabic (Mac)
10005 x-mac-hebrew Hebrew (Mac)
10006 x-mac-greek Greek (Mac)
10007 x-mac-cyrillic Cyrillic (Mac)
10008 x-mac-chinesesimp Chinese Simplified (Mac)
10010 x-mac-romanian Romanian (Mac)
10017 x-mac-ukrainian Ukrainian (Mac)
10021 x-mac-thai Thai (Mac)
10029 x-mac-ce Central European (Mac)
10079 x-mac-icelandic Icelandic (Mac)
10081 x-mac-turkish Turkish (Mac)
10082 x-mac-croatian Croatian (Mac)
12000 utf-32 Unicode (UTF-32)
12001 utf-32BE Unicode (UTF-32 Big-Endian)
20000 x-Chinese-CNS Chinese Traditional (CNS)
20001 x-cp20001 TCA Taiwan
20002 x-Chinese-Eten Chinese Traditional (Eten)
20003 x-cp20003 IBM5550 Taiwan
20004 x-cp20004 TeleText Taiwan
20005 x-cp20005 Wang Taiwan
20105 x-IA5 Western European (IA5)
20106 x-IA5-German German (IA5)
20107 x-IA5-Swedish Swedish (IA5)
20108 x-IA5-Norwegian Norwegian (IA5)
20127 us-ascii US-ASCII
20261 x-cp20261 T.61
20269 x-cp20269 ISO-6937
20273 IBM273 IBM EBCDIC (Germany)
20277 IBM277 IBM EBCDIC (Denmark-Norway)
20278 IBM278 IBM EBCDIC (Finland-Sweden)
20280 IBM280 IBM EBCDIC (Italy)
20284 IBM284 IBM EBCDIC (Spain)
20285 IBM285 IBM EBCDIC (UK)
20290 IBM290 IBM EBCDIC (Japanese katakana)
20297 IBM297 IBM EBCDIC (France)
20420 IBM420 IBM EBCDIC (Arabic)
20423 IBM423 IBM EBCDIC (Greek)
20424 IBM424 IBM EBCDIC (Hebrew)
20833 x-EBCDIC-KoreanExtended IBM EBCDIC (Korean Extended)
20838 IBM-Thai IBM EBCDIC (Thai)
20866 koi8-r Cyrillic (KOI8-R)
20871 IBM871 IBM EBCDIC (Icelandic)
20880 IBM880 IBM EBCDIC (Cyrillic Russian)
20905 IBM905 IBM EBCDIC (Turkish)
20924 IBM00924 IBM Latin-1
20932 EUC-JP Japanese (JIS 0208-1990 and 0212-1990)
20936 x-cp20936 Chinese Simplified (GB2312-80)
20949 x-cp20949 Korean Wansung
21025 cp1025 IBM EBCDIC (Cyrillic Serbian-Bulgarian)
21866 koi8-u Cyrillic (KOI8-U)
28591 iso-8859-1 Western European (ISO)
28592 iso-8859-2 Central European (ISO)
28593 iso-8859-3 Latin 3 (ISO)
28594 iso-8859-4 Baltic (ISO)
28595 iso-8859-5 Cyrillic (ISO)
28596 iso-8859-6 Arabic (ISO)
28597 iso-8859-7 Greek (ISO)
28598 iso-8859-8 Hebrew (ISO-Visual)
28599 iso-8859-9 Turkish (ISO)
28603 iso-8859-13 Estonian (ISO)
28605 iso-8859-15 Latin 9 (ISO)
29001 x-Europa Europa
38598 iso-8859-8-i Hebrew (ISO-Logical)
50220 iso-2022-jp Japanese (JIS)
50221 csISO2022JP Japanese (JIS-Allow 1 byte Kana)
50222 iso-2022-jp Japanese (JIS-Allow 1 byte Kana - SO/SI)
50225 iso-2022-kr Korean (ISO)
50227 x-cp50227 Chinese Simplified (ISO-2022)
51932 euc-jp Japanese (EUC)
51936 EUC-CN Chinese Simplified (EUC)
51949 euc-kr Korean (EUC)
52936 hz-gb-2312 Chinese Simplified (HZ)
54936 GB18030 Chinese Simplified (GB18030)
57002 x-iscii-de ISCII Devanagari
57003 x-iscii-be ISCII Bengali
57004 x-iscii-ta ISCII Tamil
57005 x-iscii-te ISCII Telugu
57006 x-iscii-as ISCII Assamese
57007 x-iscii-or ISCII Oriya
57008 x-iscii-ka ISCII Kannada
57009 x-iscii-ma ISCII Malayalam
57010 x-iscii-gu ISCII Gujarati
57011 x-iscii-pa ISCII Punjabi
65000 utf-7 Unicode (UTF-7)
65001 utf-8 Unicode (UTF-8)