塞马尔特专家讲述法院裁定如何合法化Web数据收集

尽管未经网站所有者的明确许可从网站上抓取数据可能是非法的,但法官最近在某些情况下做出了其他裁定。 hiQ Labs最近对LinkedIn提起诉讼,要求其阻止LinkedIn从LinkedIn页面提取数据。
令LinkedIn初创企业免费访问其网页的消息震惊了大多数人。 hiQ使用其算法根据用户对其公开资料所做的更改来检测LinkedIn用户何时寻找工作。
该算法在从LinkedIn网页提取的数据上运行。不出所料,LinkedIn不喜欢它,并且采取了对策来防止hiQ进一步提取数据。除了已设置的技术障碍外,还发布了措辞强烈的法律警告。
该初创企业别无选择,只能合法地处理此问题。 hiQ必须寻求法律补救。该公司希望LinkedIn下令消除技术障碍。 hiQ还希望其在LinkedIn上的数据提取过程合法化。

幸运的是,这家初创公司得到了想要的东西。该裁决有利于hiQ。领英被责令删除所有阻碍hiQ的对策,以免刮擦其(LinkedIn)网页,并放手让hiQ自由行事,因为该行为完全合法。法官的裁决是基于hiQ想要抓取的是已公开显示的数据这一事实。
法官不仅命令被告取消针对hiQ的所有预防机制,而且还命令将来应停止被告的此类行为。
促进开放的网络数据
尽管该裁定仍然是临时性的禁令,但令人欣慰的是,该裁定印证了该法律支持开放的Web数据和免费访问Internet上的信息。即使最终决定有利于被告,这一事实也已经确立。
法官通过取消几乎所有LinkedIn的论点来促进这项政策。当LinkedIn试图确定原告侵犯其隐私权时,法官则以被告也在出售数据这一事实予以反驳。
当争论不成立时,被告还指出,hiQ的行为严重违反了《计算机欺诈和滥用法案》(CFAA),因为该初创公司访问了他们的服务器以非法收集数据。同样,争论被打断了。有人以hiQ只是在不受保护的公共网页上抓取内容为由拒绝了。
法官将案件模拟为有人在营业时间走进一家露天商店。这样的人不能说是侵入。因此,hiQ并没有侵入。有趣的是,法官进一步解释了他的裁决为何符合公共利益。
简而言之,法院认为允许对数据进行爬网,提取和分析符合公共利益。因此,鼓励对信息自由流通设置障碍将是有害的政策。
您应该从该裁定中学到什么
尽管您可能没有理由直接从LinkedIn中提取数据,但您应该从该裁定中学习。最好阅读并尊重所有网站的robots.txt文件,以确保安全。请记住,该裁定仍然是临时性的禁令。它最终可能会支持LinkedIn。

尽管该裁决可能不会直接影响您,但令我们感到高兴的是,联邦法院坚持了向公众开放网络的政策。因此,可以搜索和充分利用信息的人们应该可以使用和访问信息。
Web数据对每个人都非常有用,特别是媒体分析师,开发人员,数据科学家和其他一些专业人员。因此,该裁定是可喜的发展。