标记信息并没有真正丢失,可以通过编程的方式来访问这些具有标记的数据。以下是Python示例代码:
import pandas as pd
# 创建DataFrame示例
data = {'name': ['Alice', 'Bob', 'Charlie', 'David', 'Emily'],
'age': [25, 32, 18, 47, 22],
'sex': ['F', 'M', 'M', 'M', 'F']}
df = pd.DataFrame(data)
# 将age列中小于30岁的行标记为young,大于等于30岁的行标记为old
df['age_category'] = pd.cut(df['age'], bins=[0, 30, float("inf")], labels=['young', 'old'])
# 输出DataFrame
print(df)
该代码将一个DataFrame中的年龄列拆分为两个类别(年轻和老年),并用标记对它们进行标记,以便后续的分析。可以看到,age_category列现在有两个具有标记的类别:'young'和'old'。
上一篇:标记消失和标题不显示
下一篇:标记序列化