handsomethief 发表于 2008-7-16 14:57

请教如何按列读下列格式的大数据量文本文件?

我在做SVM用于分类,得到如下格式的大数据量的文本文件(节选):
...
2 1:-0.0434783 2:0.153846 3:0.194444 4:-0.353712 ...
1 1:-0.217391 2:-0.384615 3:0.222222 4:-0.676856 ...
4 1:0.347826 2:0.307692 3:0.833333 4:-0.0829694 ...
3 1:-0.130435 2:-0.384615 3:0.166667 4:-0.519651 ...
...

说明:第一列是所属的类别标号,后面的是特征编号和特征的值,用冒号连接。

请教:我想把每个特征的值(如第一号特征)读出来进行某些处理(如归一化),再回填回去,有什么简单点的方法能直接按列读每个特征的所有的值?谢谢!!

[ 本帖最后由 handsomethief 于 2008-7-16 15:03 编辑 ]

sogooda 发表于 2008-7-16 19:20

看看本版的置顶帖和精华帖吧。
页: [1]
查看完整版本: 请教如何按列读下列格式的大数据量文本文件?