可以使用pandas库中的groupby和sample方法。
示例代码:
import pandas as pd
df = pd.DataFrame({ 'A': ['foo', 'foo', 'bar', 'bar', 'baz', 'baz'], 'B': [1, 2, 3, 4, 5, 6], 'C': [10, 20, 30, 40, 50, 60] })
sampled_rows = df.groupby('A').apply(pd.DataFrame.sample, n=2)
print(sampled_rows)
输出结果:
A B C
A
bar 3 bar 4 40
2 bar 3 30
baz 5 baz 6 60
4 baz 5 50
foo 1 foo 2 20
0 foo 1 10
其中,sampled_rows是一个包含了随机选择的行的DataFrame。每个唯一值会随机选择n行,可以通过修改n来改变结果。