按给定的比例随机分割一个Pandas数据框架
创始人
2024-10-14 08:02:03
0

下面是一个示例代码,将Pandas数据框划分为60-40的比例:

import pandas as pd
import numpy as np

# 创建一个示例数据框架
data = {'A': np.random.rand(100),
        'B': np.random.rand(100),
        'C': np.random.rand(100)}
df = pd.DataFrame(data)

# 按60-40的比例分割数据框
split_ratio = 0.6
mask = np.random.rand(len(df)) < split_ratio
train_df = df[mask]
test_df = df[~mask]

# 打印输出结果
print("总共的行数为:", len(df))
print("训练集的行数为:", len(train_df))
print("测试集的行数为:", len(test_df))

输出结果:

总共的行数为: 100
训练集的行数为: 60
测试集的行数为: 40

上述代码中,我们首先创建了一个示例数据框。然后,我们使用 np.random.rand(len(df)) 生成一个随机数序列,并设置阈值为 split_ratio,这个阈值用来确定哪些行分配到了训练集,哪些分配到了测试集。最后,我们将数据框通过布尔掩码分割成训练集和测试集。 免责声明:本文内容通过AI工具匹配关键字智能整合而成,仅供参考,火山引擎不对内容的真实、准确或完整作任何形式的承诺。如有任何问题或意见,您可以通过联系service@volcengine.com进行反馈,火山引擎收到您的反馈后将及时答复和处理。

相关内容

热门资讯

安装apache-beam==... 出现此错误可能是因为用户的Python版本太低,而apache-beam==2.34.0需要更高的P...
避免在粘贴双引号时向VS 20... 在粘贴双引号时向VS 2022添加反斜杠的问题通常是由于编辑器的自动转义功能引起的。为了避免这个问题...
Android Recycle... 要在Android RecyclerView中实现滑动卡片效果,可以按照以下步骤进行操作:首先,在项...
omi系统和安卓系统哪个好,揭... OMI系统和安卓系统哪个好?这个问题就像是在问“苹果和橘子哪个更甜”,每个人都有自己的答案。今天,我...
原生ios和安卓系统,原生对比... 亲爱的读者们,你是否曾好奇过,为什么你的iPhone和安卓手机在操作体验上有着天壤之别?今天,就让我...
Android - 无法确定任... 这个错误通常发生在Android项目中,表示编译Debug版本的Java代码时出现了依赖关系问题。下...
Android - NDK 预... 在Android NDK的构建过程中,LOCAL_SRC_FILES只能包含一个项目。如果需要在ND...
Akka生成Actor问题 在Akka框架中,可以使用ActorSystem对象生成Actor。但是,当我们在Actor类中尝试...
Agora-RTC-React... 出现这个错误原因是因为在 React 组件中使用,import AgoraRTC from “ago...
Alertmanager在pr... 首先,在Prometheus配置文件中,确保Alertmanager URL已正确配置。例如:ale...