Skip to content

Charles Note

Tech, Science, Computer, Economics, Reading and others

Tech 科技/
Science 科學/
Reading 閱讀/
About 關於/
Contact 聯絡/

ProgrammingPython

Python / 如何處裡亞洲文字(Unicode, UTF-8)？以兩個字元計算顯示長度？轉換字串與bytes？

目錄

將 utf-8 字串轉換為 bytes 格式，並計算 bytes 長度

▍將 utf-8 字串轉換為 bytes 格式，並計算 bytes 長度

s = 'test123字串' #包含中文字的字串
sb = s.encode('utf-8') #b'test123\xe5\xad\x97\xe4\xb8\xb2'
len(sb) #13

使用 encode() 函數可將字串轉換為 bytes 格式，若將 bytes 印出來可以看到字串最前面是以 b'' 開頭顯示表示此為 bytes array。其中可見原本標準的 ASCII 字元能然維持一個 byte 長度，而且直接顯示字元。如果是 Unicode 文字則是用 \x 16進位的方式表示，且以中文字為例在 UTF-8 編碼下是 3 個 bytes 長度。例如：”串”的 Unicode 編碼為 \xe4\xb8\xb2。

若要取得字串的 bytes 總長度，在轉換成 bytes 格式之後可以直接使用 len() 函數取得長度。

Reference

How can I determine the byte length of a utf-8 encoded string in Python? | stack overflow
Character count of Unicode string | stack overflow

Copyright announcement:
the featured image: Photo by Kristian Strand on Unsplash

bytes, characters, Python, string, Unicode, utf-8, 亞洲文字, 字串處理, 程式設計, 編碼

Post navigation

Mac / Python使用Selenium爬蟲無法開啟chromedriver

SQLite / 語法筆記

Search for:

Recent Posts

透過 DVDFab 備份 4K UHD 光碟 (需使用特定 UHD BD 藍光燒錄機並刷韌體降版)
Winsows / 如何為不明裝置安裝驅動程式 (unknown device)
Excel / 利用萬用字元搜尋欄位內容包含某字串並加總數值 (Sum if cells contain specific text)
SQL Server / 取得資料表使用的容量大小
影音剪輯 / 使用 ffmpeg 分割影片 (指定開始及結束時間或固定時間長度分割)

Recent Comments

Charles on WordPress / 架站教學一：使用 Google 台灣主機免費架設自己的網站 (Mac/Win版)
Charles on WordPress / 架站教學一：使用 Google 台灣主機免費架設自己的網站 (Mac/Win版)
Neil on WordPress / 架站教學二：透過 SSH 連線遠端控制 GCP 並架設 FTP 伺服器 (使用 WordPress Bitnami)
一 on WordPress / 架站教學一：使用 Google 台灣主機免費架設自己的網站 (Mac/Win版)
一 on WordPress / 架站教學一：使用 Google 台灣主機免費架設自己的網站 (Mac/Win版)

Archives

October 2023
June 2023
March 2023
August 2021
June 2021
May 2021
April 2021
April 2020
March 2020
November 2019
September 2019
August 2019

Categories

Computer 電腦
CSS
Design 設計
English Post
Excel
Front-end 網頁前端
Google Cloud
HTML
Life Tech 生活科技
MacOS
MySQL
Programming
Python
SQL Server
SQLite
Tech 科技
Windows
WordPress

Meta

Log in
Entries feed
Comments feed
WordPress.org

Newsletter

Categories

Computer 電腦
CSS
Design 設計
English Post
Excel
Front-end 網頁前端
Google Cloud
HTML
Life Tech 生活科技
MacOS
MySQL
Programming
Python
SQL Server
SQLite
Tech 科技
Windows
WordPress

Recent Posts

透過 DVDFab 備份 4K UHD 光碟 (需使用特定 UHD BD 藍光燒錄機並刷韌體降版)
Winsows / 如何為不明裝置安裝驅動程式 (unknown device)
Excel / 利用萬用字元搜尋欄位內容包含某字串並加總數值 (Sum if cells contain specific text)
SQL Server / 取得資料表使用的容量大小
影音剪輯 / 使用 ffmpeg 分割影片 (指定開始及結束時間或固定時間長度分割)

Meta

Log in
Entries feed
Comments feed
WordPress.org

Newsletter

Copyright © 2024 Charles Note. All rights reserved. | Designed by Precise Themes