按给定的比例随机分割一个Pandas数据框架
创始人
2024-10-14 08:02:03
0

下面是一个示例代码,将Pandas数据框划分为60-40的比例:

import pandas as pd
import numpy as np

# 创建一个示例数据框架
data = {'A': np.random.rand(100),
        'B': np.random.rand(100),
        'C': np.random.rand(100)}
df = pd.DataFrame(data)

# 按60-40的比例分割数据框
split_ratio = 0.6
mask = np.random.rand(len(df)) < split_ratio
train_df = df[mask]
test_df = df[~mask]

# 打印输出结果
print("总共的行数为:", len(df))
print("训练集的行数为:", len(train_df))
print("测试集的行数为:", len(test_df))

输出结果:

总共的行数为: 100
训练集的行数为: 60
测试集的行数为: 40

上述代码中,我们首先创建了一个示例数据框。然后,我们使用 np.random.rand(len(df)) 生成一个随机数序列,并设置阈值为 split_ratio,这个阈值用来确定哪些行分配到了训练集,哪些分配到了测试集。最后,我们将数据框通过布尔掩码分割成训练集和测试集。 免责声明:本文内容通过AI工具匹配关键字智能整合而成,仅供参考,火山引擎不对内容的真实、准确或完整作任何形式的承诺。如有任何问题或意见,您可以通过联系service@volcengine.com进行反馈,火山引擎收到您的反馈后将及时答复和处理。

相关内容

热门资讯

Android Recycle... 要在Android RecyclerView中实现滑动卡片效果,可以按照以下步骤进行操作:首先,在项...
安装apache-beam==... 出现此错误可能是因为用户的Python版本太低,而apache-beam==2.34.0需要更高的P...
Android - 无法确定任... 这个错误通常发生在Android项目中,表示编译Debug版本的Java代码时出现了依赖关系问题。下...
Android - NDK 预... 在Android NDK的构建过程中,LOCAL_SRC_FILES只能包含一个项目。如果需要在ND...
Alertmanager在pr... 首先,在Prometheus配置文件中,确保Alertmanager URL已正确配置。例如:ale...
Akka生成Actor问题 在Akka框架中,可以使用ActorSystem对象生成Actor。但是,当我们在Actor类中尝试...
Agora-RTC-React... 出现这个错误原因是因为在 React 组件中使用,import AgoraRTC from “ago...
Aksnginxdomainb... 在AKS集群中,可以使用Nginx代理服务器实现根据域名进行路由。以下是具体步骤:部署Nginx i...
Alertmanager中的基... Alertmanager中可以使用repeat_interval选项指定在一个告警重复发送前必须等待...
AddSingleton在.N... 在C#中创建Singleton对象通常是通过私有构造函数和静态属性来实现,例如:public cla...