keras字符编码

2023-06-19 21:36•Android•阅读 1328

https://www.jianshu.com/p/258a21ae0390
https://blog.csdn.net/apengpengpeng/article/details/80866034
#-*-coding:utf-8-*-
# import numpy as np
#
# samples = ['The cat sat on the mat.', 'The dog ate my homework.']
#
# # 10
# # 定义一个集合，得到{'The': 1, 'cat': 2, 'sat': 3, 'on': 4, 'the': 5, 'mat.': 6, 'dog': 7, 'ate': 8, 'my': 9, 'homework.': 10}，也就是筛选出这个句子中对应的了哪些词，然后并赋予索引值，其实就是个词库
# token_index = {}
# for sample in samples:
#     for word in sample.split():
#         if word not in token_index:
#             token_index[word] = len(token_index) + 1
#
# #　限制了读取的句子的长度，一句话最长10个词
# print(token_index)
# max_length = 10
# results = np.zeros(shape=(len(samples),
#                           max_length,
#                           max(token_index.values()) + 1))
#
# # print(results) 2, 10, 11
# for i, sample in enumerate(samples):
#     for j, word in list(enumerate(sample.split()))[:max_length]:
#         index = token_index.get(word)
#         results[i, j, index] = 1.
# print(results)
import numpy as np
import string
samples = ['The cat sat on the mat.', 'The dog ate my homework.']
# 预先定义一个字符集 '0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ!"#$%&\\'()*+,-./:;<=>?@[\\]^_`{|}~‘
characters = string.printable
token_index = dict(zip(range(1, len(characters) + 1), characters))
max_length = 50
results = np.zeros((len(samples), max_length, max(token_index.keys()) + 1))
for i, sample in enumerate(samples):
for j, character in enumerate(sample):
for key, value in token_index.items():
if value == character:
                index = key
                results[i, j, index] = 1.
print(results)

上一篇 »php转换字符编码为utf-8
下一篇 »PHP中文字符gbk编码与UTF-8编码的转换

keras字符编码

相关推荐

Java处理不同的字符编码流

PHP处理base64编码字符串

javascript 编码

javascript 字符串进行 utf8 编码的方法，转

PHP 判断字符的编码 并输出想要的编码格式字符 ，转

PHP中SimpleXMLElement对象字符编码

php自动获取字符串编码函数mb_detect_encoding，转

python设置默认字符编码

PHP 判断字符的编码并输出想要的编码格式字符，转