当前位置:网站首页>爬虫注意
爬虫注意
2022-08-03 15:21:00 【51CTO】
最近的大数据行业,风声鹤唳。在中秋节前一天,中国电信控股的子公司天翼征信传出风声,其总经理、副总经理以及市场人员被警察带走,原因是与其合作的大数据公司被警方调查。在天翼之前,新颜科技CEO黄向前被警方带走、魔蝎科技公司CEO 周江翔涉事被查、公信宝公司门口被贴了封条、知名第三方数据服务公司 聚信立宣布将暂停对外提供用户授权的运营商爬虫服务……
此外,国内大数据风控平台龙头 同盾科技也被曝爬虫部门已解散,CEO蒋韬已出国避风头,对此,同盾科技昨日发表辟谣声明表示,子公司杭州信川科技有限公司确实停止爬虫业务,但其他言论均属不实。
据内部消息,最近监管对数据乱象出手,开始清理行动,15家公司被列入调查名单,其中几家估值都超几十亿。国内很多大数据公司的数据来源多多少少都有一定的问题,随着我国今年6月1日起,《 中华人民共和国网络安全法》将实施,所有的网上行为将越来越严格,如果还按照之前的惯性去操作,迟早会出问题。
程序员谨慎使用技术
不知道大家是否发现,随着国家经济的不断发展,以前可能处于灰色阶段的行业,现在几乎都慢慢不能做了。写这篇文章的目的,也是为了警示大家技术是无罪的,但是用到了错的地方代价也是非常巨大的。我之前看过这样一个报道,一个程序员因为爱好写了一个程序( 入侵工具),并且把此程序上传到了互联网上,没想到过了两年之后,有人利用这个小程序非法获利500多万。
虽然这名程序员并没有因为这个程序而获利,但是间接给犯罪人员提供了犯罪的工具,最后被判刑 2 年缓期 2 年执行。程序员的生活是简单的,工作大概也只关心代码和BUG。小明也从来没有把自己的职业和犯罪联系在一起。
技术本身是不违法的,就好像一把水果刀,如果用来削苹果削梨没有任何问题,但是用来伤人就是凶器,就要被列入物证list。爬虫也是如此,在大多数情况下,只是采集互联网上的公开信息,很难说是违法行为。
但是一旦涉及入侵到别人系统去获取数据,那必然存在着法律风险。可能很多同学是懵的,很多互联网公司就是靠抓取数据活着的。他只是正常执行公司安排的工作任务,怎么就涉嫌犯罪了呢?这里结合律师朋友给出的一些建议,这里摘录出来仅供参考。
单位犯罪和个人犯罪的关系
首先了解一下单位犯罪。除了自然人犯罪,还有单位犯罪,是指公司、企业、事业单位、机关、团体为单位谋取利益,经单位决策机构或者负责人决定实施的,法律规定应当负刑事责任的危害社会的行为。我国刑法对单位犯罪原则上采取双罚制度,即单位犯罪的,对单位判处罚金,并对其直接负责的主管人员和其他直接责任人员判处刑罚。
相关司法解释规定,在审理单位故意犯罪案件时,对其直接负责的主管人员和其他直接责任人员,可不区分主犯、从犯,按照其在单位犯罪中所起的作用判处刑罚。因此,公司犯罪有可能会牵连员工,尤其是案件中对非法获取数据有直接责任的爬虫工程师。
这也是为什么当事人在公司人小言微但还是被批捕的原因。其次,是否可以“ 不知者不为罪”来辩解?刑法原则之一是法无明文规定不为罪,并没有“不知者不为罪”。主观上的恶意是衡量犯罪的要素之一,结合客观上的行为来推理主观恶意。别人的服务器,获取别人不公开的信息,不能说没有恶意,不能以不懂法来搪塞。
重点:什么样的爬虫是违法?
如果爬虫程序采集到公民的姓名、身份证件号码、通信通讯联系方式、住址、账号密码、财产状况、行踪轨迹等个人信息,并将之用于非法途径的,则肯定构成非法获取公民个人信息的违法行为。除此之外,根据相关规定,对于违反国家有关规定,向他人出售或者提供公民个人信息,情节严重的,窃取或者以其他方法非法获取公民个人信息的,均可构成成“ 侵犯公民个人信息罪”,处三年以下有期徒刑或者拘役,并处或者单处罚金;情节特别严重的,处三年以上七年以下有期徒刑,并处罚金。重点关注:下列情况下,爬虫有可能违法,严重的甚至构成犯罪。
- 爬虫程序规避网站经营者设置的反爬虫措施或者服务器防抓取措施,非法获取相关信息,情节严重的,有可能构成“非法获取计算机信息系统数据罪”。
- 爬虫程序干扰被访问的网站或系统正常运营,后果严重的,触犯刑法,构成“ 破坏计算机信息系统罪”
- 爬虫采集的信息属于公民个人信息的,有可能构成非法获取公民个人信息的违法行为,情节严重的,有可能构成“侵犯公民个人信息罪”。
边栏推荐
猜你喜欢
问题6:下拉框测试点
2021年12月电子学会图形化一级编程题解析含答案:下雨
6000 字+,帮你搞懂互联网架构演变历程!
身为售后工程师的我还是觉得软件测试香,转行成功定薪11.5K,特来分享下经验。
WMS软件国内主要供应商分析
今日睡眠质量记录75分
你没见过的《老友记》镜头,AI给补出来了|ECCV 2022
JS每晚24:00更新某方法
Deep Learning - Install CUDA and CUDNN to implement GPU operation of tensorflow
Daily practice------There are 10 numbers that are required to be output from large to small by selection method
随机推荐
JS手写call apply bind (详细)(面试)
cnpm 安装成功后提示不是内部和外部命令,也不是可运行的命令解决方案
Several methods of installing Mysql in Linux
JS handwritten call apply bind (detailed) (interview)
sql注入之报错注入(精简详细)
力扣1206. 设计跳表--SkipList跳表是怎么跳的?
No inner demons, to dry!SQL optimization and diagnosis
自己悦表存心
web漏洞之远程命令/代码执行
交大医学院临床研究中心如何将 ModelWhale 应用于临床医生教学、研究丨数据科学 x 临床医学
指令重排以及案例
方舟生存进化开服需要多少钱
问题6:下拉框测试点
地球自转加快
新版本MaxCompute 的SQL支持 UDF 分区裁剪的逻辑是怎样的?
rust编程基础
liunx服务器nohup不输出日志文件的方法
深度学习——安装CUDA以及CUDNN实现tensorflow的GPU运行
[The Beauty of Software Engineering - Column Notes] 36 | What exactly do DevOps engineers do?
随笔-UGUI中LayoutGroup来自适应长度图片长度