当前位置:网站首页>爬虫注意
爬虫注意
2022-08-03 15:21:00 【51CTO】
最近的大数据行业,风声鹤唳。在中秋节前一天,中国电信控股的子公司天翼征信传出风声,其总经理、副总经理以及市场人员被警察带走,原因是与其合作的大数据公司被警方调查。在天翼之前,新颜科技CEO黄向前被警方带走、魔蝎科技公司CEO 周江翔涉事被查、公信宝公司门口被贴了封条、知名第三方数据服务公司 聚信立宣布将暂停对外提供用户授权的运营商爬虫服务……
此外,国内大数据风控平台龙头 同盾科技也被曝爬虫部门已解散,CEO蒋韬已出国避风头,对此,同盾科技昨日发表辟谣声明表示,子公司杭州信川科技有限公司确实停止爬虫业务,但其他言论均属不实。
据内部消息,最近监管对数据乱象出手,开始清理行动,15家公司被列入调查名单,其中几家估值都超几十亿。国内很多大数据公司的数据来源多多少少都有一定的问题,随着我国今年6月1日起,《 中华人民共和国网络安全法》将实施,所有的网上行为将越来越严格,如果还按照之前的惯性去操作,迟早会出问题。
程序员谨慎使用技术
不知道大家是否发现,随着国家经济的不断发展,以前可能处于灰色阶段的行业,现在几乎都慢慢不能做了。写这篇文章的目的,也是为了警示大家技术是无罪的,但是用到了错的地方代价也是非常巨大的。我之前看过这样一个报道,一个程序员因为爱好写了一个程序( 入侵工具),并且把此程序上传到了互联网上,没想到过了两年之后,有人利用这个小程序非法获利500多万。
虽然这名程序员并没有因为这个程序而获利,但是间接给犯罪人员提供了犯罪的工具,最后被判刑 2 年缓期 2 年执行。程序员的生活是简单的,工作大概也只关心代码和BUG。小明也从来没有把自己的职业和犯罪联系在一起。
技术本身是不违法的,就好像一把水果刀,如果用来削苹果削梨没有任何问题,但是用来伤人就是凶器,就要被列入物证list。爬虫也是如此,在大多数情况下,只是采集互联网上的公开信息,很难说是违法行为。
但是一旦涉及入侵到别人系统去获取数据,那必然存在着法律风险。可能很多同学是懵的,很多互联网公司就是靠抓取数据活着的。他只是正常执行公司安排的工作任务,怎么就涉嫌犯罪了呢?这里结合律师朋友给出的一些建议,这里摘录出来仅供参考。
单位犯罪和个人犯罪的关系
首先了解一下单位犯罪。除了自然人犯罪,还有单位犯罪,是指公司、企业、事业单位、机关、团体为单位谋取利益,经单位决策机构或者负责人决定实施的,法律规定应当负刑事责任的危害社会的行为。我国刑法对单位犯罪原则上采取双罚制度,即单位犯罪的,对单位判处罚金,并对其直接负责的主管人员和其他直接责任人员判处刑罚。
相关司法解释规定,在审理单位故意犯罪案件时,对其直接负责的主管人员和其他直接责任人员,可不区分主犯、从犯,按照其在单位犯罪中所起的作用判处刑罚。因此,公司犯罪有可能会牵连员工,尤其是案件中对非法获取数据有直接责任的爬虫工程师。
这也是为什么当事人在公司人小言微但还是被批捕的原因。其次,是否可以“ 不知者不为罪”来辩解?刑法原则之一是法无明文规定不为罪,并没有“不知者不为罪”。主观上的恶意是衡量犯罪的要素之一,结合客观上的行为来推理主观恶意。别人的服务器,获取别人不公开的信息,不能说没有恶意,不能以不懂法来搪塞。
重点:什么样的爬虫是违法?
如果爬虫程序采集到公民的姓名、身份证件号码、通信通讯联系方式、住址、账号密码、财产状况、行踪轨迹等个人信息,并将之用于非法途径的,则肯定构成非法获取公民个人信息的违法行为。除此之外,根据相关规定,对于违反国家有关规定,向他人出售或者提供公民个人信息,情节严重的,窃取或者以其他方法非法获取公民个人信息的,均可构成成“ 侵犯公民个人信息罪”,处三年以下有期徒刑或者拘役,并处或者单处罚金;情节特别严重的,处三年以上七年以下有期徒刑,并处罚金。重点关注:下列情况下,爬虫有可能违法,严重的甚至构成犯罪。
- 爬虫程序规避网站经营者设置的反爬虫措施或者服务器防抓取措施,非法获取相关信息,情节严重的,有可能构成“非法获取计算机信息系统数据罪”。
- 爬虫程序干扰被访问的网站或系统正常运营,后果严重的,触犯刑法,构成“ 破坏计算机信息系统罪”
- 爬虫采集的信息属于公民个人信息的,有可能构成非法获取公民个人信息的违法行为,情节严重的,有可能构成“侵犯公民个人信息罪”。
边栏推荐
猜你喜欢

在北极都可以穿短袖了,温度飙升至32.5℃

nodeJs--跨域

A high-performance creation book, ASUS Dreadnought Pro15 2022 is completely enough for daily photo editing and editing!

Windows服务器如何防止黑客入侵的安全设置

2021年12月电子学会图形化四级编程题解析含答案:棕熊大战

2021年12月电子学会图形化一级编程题解析含答案:下雨

2021年12月电子学会图形化三级编程题解析含答案:分身术

MySQL性能优化的'4工具+10技巧'

Three key expectations for the crypto market in August Price moves north?Still expected to be in turmoil

云硬盘EVS详解以及如何用与避坑【华为云至简致远】
随机推荐
如何用二分法搜索、查找旋转数组中是否含有某个(目标)值? leetcode 81.搜索旋转排序数组
一文搞懂$_POST和php://input的区别
gocron定时任务管理系统的安装与运行
程序员面试必备PHP基础面试题 – 第十九天
问题9:为什么有边界值的测试?
2021年12月电子学会图形化一级编程题解析含答案:放学
R7 6800H+RTX3050+120Hz 2.8K OLED screen, Intrepid Pro15 2022 pre-sale
一通骚操作,我把SQL执行效率提高了10000000倍!
每日练习------有10个数字要求分别用选择法从大到小输出
【指针内功修炼】函数指针 + 函数指针数组 + 回调函数(二)
云硬盘EVS详解以及如何用与避坑【华为云至简致远】
rust编程基础
雷克萨斯lm的安全性如何,通过两个角度来聊这个话题
取消转义字符(r)
Daily practice------There are 10 numbers that are required to be output from large to small by selection method
2021年12月电子学会图形化四级编程题解析含答案:森林运动会
一对多查询(分页)
高性能创作本,日常修图剪辑选华硕无畏Pro15 2022完全足矣!
分布式系统与微服务的区别
个人秋招记录——欢迎交流