博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Theano mnist数据集格式
阅读量:6995 次
发布时间:2019-06-27

本文共 1096 字,大约阅读时间需要 3 分钟。

首先链接一篇大牛的Theano文档翻译:http://www.cnblogs.com/xueliangliu/archive/2013/04/03/2997437.html

里面有mnist.pkl.gz 手动下载地址(因为代码里也有自动下载方法)

 

那么我不是做图像处理的,所以对图像的存储格式没有什么概念,我要以其他方式输入进theano程序中怎么办呢?

于是就得分析它的存储格式。代码(logistic_sgd.py,line 195)注释中说的已经很清楚了:

#train_set, valid_set, test_set format: tuple(input, target)#input is an numpy.ndarray of 2 dimensions (a matrix)#witch row's correspond to an example. target is a#numpy.ndarray of 1 dimensions (vector)) that have the same length as#the number of rows in the input. It should give the target#target to the example with the same index in the input.

那么就是说train_X是一个rows行2列的矩阵,train_Y是一个rows维的向量,而train_set是train_X和train_Y的一个组合

那么我们只需要读文件构建矩阵和向量,然后share成theano程序里的类型就ok啦

 

 

 

===================割=========================

想不到后来又重拾DL,如今已经是今非昔比了啊

再次补充一下Mnist数据集的格式

import cPickle, gzip, numpy# Load the datasetf = gzip.open('mnist.pkl.gz', 'rb')train_set, valid_set, test_set = cPickle.load(f)f.close()

事实证明它会返回一个tuple,分别是train vali test集。

每个集有两维,以train set为例,分别是(50000, 784) (50000,1)代表着5W个样本和5W个label,

每个样本有784个维度 = 28*28

转载于:https://www.cnblogs.com/zklidd/p/3886597.html

你可能感兴趣的文章
Android开机自启动程序
查看>>
php弱类型
查看>>
vim
查看>>
【转载】MapReduce编程 Intellij Idea配置MapReduce编程环境
查看>>
安装配置管理 之 Fedora 6.0 蓝牙bluebooth传送文件的问题解决方法
查看>>
C 结构
查看>>
spring 加载不了jdbc.properties文件的数据问题
查看>>
JQuery Plugin 2 - Passing Options into Your Plugin
查看>>
长尾分布(幂律分布)
查看>>
Android提高--索引
查看>>
队列(Queue)-c实现
查看>>
DevExpress控件使用系列--ASPxGridView+Popup+Tab
查看>>
MySql5.7配置文件my.cnf设置
查看>>
set names utf8;
查看>>
异常处理
查看>>
go学习之文件读取问题(需更新)
查看>>
quartus15.1 下程程序 电脑蓝屏 解决方法
查看>>
利用c:forEach标签遍历数组
查看>>
Java集合List随堂
查看>>
HDU_1542_线段树【扫描线】
查看>>