这段时间开始学习了做软件,当然并没有决定转行从事相关工作,仅仅是好奇以及觉得好玩。
其实这份好奇在很早就有了,但是一直也没有去做,原因也很简单--不知道从何入手。对于菜鸟来说这是一个很难解决的问题。
不过好在有之前学习设计的一点点经验,可以拿来也用一下,在这里我先声明一下,看完这篇文章,你不会学到解决“菜鸟学习如何做软件”这个问题的答案。这篇文章仅仅是我的一点小心得以及做的一款软件的过程。
接着刚刚的话题来说,以前学习设计能够入门的最基本方法就是,避开概念从基础实例开始。对于一个新领域的学习,概念是最难懂的,因为每一个概念对学习者都是陌生的不能再陌生,学习概念要不断的往脑子里灌输新的知识,这是一个极其耗费“注意力”的过程,而“注意力”在一段时间内是有限的,用完了就开始“犯困”,学不下去啦。
这也是为什么学习新概念总是一件“痛苦”的事情。
那么从基础实例开始学习就真的有用吗?从我个人的经验来说是有用的,首先一点学习基础实例是把“抽象的概念”具体化了,能够通过简单的操作,就可以做出一个“活生生的东西”来,这是一个很神奇的过程。
由于是基础实例,并不需要太多的概念就可以看到结果,这很大程度上是刺激大脑中成就感的产生,愿意继续学习下去。
那么概念这东西是不是就不重要了呢?
当然不是了,而且恰恰相反,概念非常非常的重要,想要在某个领域达到一定的高度,必须要掌握这个领域的概念。
既然概念重要,那就不得不去学习,这好像和之前说的避开概念从基础实例开始,有一些矛盾和冲突。
难道只学习基础实例就能学会概念了吗?
当然不会了,但是学习大量的基础实例以后,会改变一个东西,就是相关领域的概念会变得“不那么新”了,对于不是全新的东西,学起来会相对的容易很多了。
这里面的道理也很多简单,很多概念在你学习了大量的基础实例以后,即使不知道这个概念的具体内容,却知道它具体用在哪里。当你再次看概念的时候,就会有一种似曾相识的感觉。
好了,啰哩啰嗦地说了一堆话,好像并没有什么卵用啊。
接下来进入实例讲解的环节,我做软件用到的工具是“易语言”,特别鸡肋的一个工具,原因很多用过的人都知道,它的优点:使用方便,学起来简单;它的缺点:用它做出来的软件各大安全卫士、杀毒软件都会报毒。
特别的尴尬。。。
我作为普通的学习爱好者,使用方便学起来简单是我首要考虑的问题,所以它还是很适合我的。
下面来说我昨天做的一个软件。
这是一款可以采集网页数据的工具,先看截图;
我从早上6点半开始做,一直做到9点半才算做完,用了3个小时,虽然功能不是十分的强大,但是已经做出我想要的结果了。
软件现在想来并没有那么复杂,但是昨天做的时候,确实费了挺大的功夫。
在这里我先说一下,本身我是使用过“火车头采集器”、“八爪鱼采集器”这些现成的采集数据的软件,所以是知道基本的采集原理,这一点很重要。
因为我知道原理,所以可以把功能拆分到具体细节,然后逐一击破。
网页数据的采集大概分成这么几步:
第一、网址的采集;
第二、网页源码的获取;
第三、源码中有用信息的提取;
第四、数据的展示以及处理;
第五、数据的输出;
下面我比较详细的说一说:
1.采集网址:你要知道你的数据在什么网站上,网站的具体页面网址是什么,我做的软件是可以采集多个页面的,那么就要涉及到页码的替换添加。这里我只说我的软件,不讲太复杂的多级采集网址,只是手动添加。
2.网页源码的获取:
我在做的时候遇到的困难,由于网页编码的不匹配,我在做的过程中,出现了中文是乱码的情况,尝试了本身工具自带的转码编写,没有成功,所以最终选择了,常用的精易模块来实现的。
转码前
转码后
3.源码中有用信息的提取:
我的软件用到的是截取法,这种方法简单直观,一条有用数据,它前面会有一段信息,它的后面也会有一段信息。通过找到这两段信息,实现取中间有用内容的方法,原理就是这个。
之前做贴吧提取邮箱的时候,用到了另外的一个方法:正则表达式,就是符合某种格式的源码,我们都提取出来,比如邮箱就是 包含@的一串字符。
这次软件做了三组数据的提取。
4.数据处理,我这个软件基本没有,就是采集的内容直接用一个超级列表框显示出来。
5.还没有做导出功能,是一个缺陷,之后会加上。
我在做软件的时候,很多知识点都是从百度去查找,就像拼积木一样,我脑子里有一个大概的样子,然后需要什么就去找什么。
学习就是一个解决问题的过程,今天的文章就这些内容。
欢迎关注我的微信公众号: 287分享。
本文暂时没有评论,来添加一个吧(●'◡'●)