请教如何按列读下列格式的大数据量文本文件?
我在做SVM用于分类,得到如下格式的大数据量的文本文件(节选):...
2 1:-0.0434783 2:0.153846 3:0.194444 4:-0.353712 ...
1 1:-0.217391 2:-0.384615 3:0.222222 4:-0.676856 ...
4 1:0.347826 2:0.307692 3:0.833333 4:-0.0829694 ...
3 1:-0.130435 2:-0.384615 3:0.166667 4:-0.519651 ...
...
说明:第一列是所属的类别标号,后面的是特征编号和特征的值,用冒号连接。
请教:我想把每个特征的值(如第一号特征)读出来进行某些处理(如归一化),再回填回去,有什么简单点的方法能直接按列读每个特征的所有的值?谢谢!!
[ 本帖最后由 handsomethief 于 2008-7-16 15:03 编辑 ] 看看本版的置顶帖和精华帖吧。
页:
[1]