网络黑产分析赛道 | 打击黄牛,请出拳!新型Black SEO,请挑战!(转发抽奖)
2024-10-30 00:19:0 Author: mp.weixin.qq.com(查看原文) 阅读量:24 收藏


由清华大学网络科学与网络空间研究院、奇安信集团、蚂蚁集团、广东联通、百度安全、赛尔网络、北京航空航天大学国家卓越工程师学院主办,复旦大学计算机科学技术学院、西安交通大学、腾讯安全应急响应中心、北京蓝莲网安科技有限公司协办的DataCon 2024大数据安全分析竞赛
报名正在进行中

本届比赛设置五大赛道,包括AI安全赛道、软件供应链安全赛道、网络基础设施安全赛道、网络黑产分析赛道和漏洞分析赛道。DataCon将考察点聚焦于行业热点议题,以解决企业实际业务需求,高校和知名安全企业联合参与命题当中,考察参赛者理论水平的同时检验大数据分析能力。本次比赛网络黑产分析赛道包括黄牛挂号日志分析和搜索引擎优化两项挑战。

挑战一:黄牛挂号日志分析
顶尖三甲医院拥有众多知名专家和稀缺的医疗资源,热门科室和专家的号源常常供不应求。这种稀缺性吸引了大量的黄牛,他们利用技术手段或人力抢占医院的挂号资源,通过抢号后高价倒卖牟取暴利。黄牛行为不仅加剧了普通患者的挂号难度,还影响了医疗系统的公平性,导致医院服务秩序混乱,损害了患者的合法权益。可以说,日常生活中不止普通患者受到黄牛的危害,医院也同样如此。为应对这一问题,有关部门采取了一系列措施,包括实名制挂号、引入动态验证码和加强法律监管,但黄牛问题仍未完全绝,成为困扰医院和患者的顽疾。

为了帮助医院打击黄牛行为,维护健康的就医氛围,在与国内某顶尖三甲医院反复沟通交流后,DataCon开设了“黄牛挂号日志分析”赛题,我们为选手提供了真实的挂号APP端导出的挂号日志信息,要求选手从提供的数据集中精准检测出疑似黄牛抢购异常行为的挂号记录,探索新型黄牛对抗与检测手段黄牛抢购行为包括但不限于事先囤积大量号源进行转卖或直接使用患者身份信息代为挂号。参赛选手可以利用各种技术,包括但不限于规则匹配、大语言模型检测、机器学习检测方法等。

参赛选手需要分别应对两个挑战:1、从海量数据中确定抢购行为的主要特征和模式。需要挑战者调研社会现状,结合数据字段,寻找黄牛抢购行为对应的日志信息的数据特征;2、使用可靠可信高效的方法实现大规模异常日志记录的发现和验证。挑战者需要尽可能准确的从给定数据中筛选出认为是黄牛抢购行为对应的异常日志信息,检测方法不能宽松,误伤正常用户,也不能太严格,错过真正的黄牛。
考虑到挂号数据中包含大量用户敏感信息,出题团队已对数据进行了脱敏和混淆处理,以确保数据能够安全公开。此外,基于大量专家经验,我们确认了数据中存在的黄牛抢购日志,作为赛题答案的参考依据。值得特别强调的是,本赛题的优秀战队将有机会与医院深入合作,并获得更多宝贵的数据集,用于科研创新。
挑战二:搜索引擎优化
搜索引擎优化(Search Engine Optimization,简称SEO ) 是一种通过了解搜索引擎的运作规则来提高网站在搜索引擎内排名的方法,从而增加网站的可见度和访问量。
这种技术涉及网站结构、内容质量、关键词策略等多个方面。然而,一些不法分子滥用SEO技术,发展出“黑帽SEO(Black Hat SEO)”,通过欺骗或操纵搜索引擎算法获得不正当排名优势。常见手法包括关键词堆砌、链接农场等,严重影响用户体验和互联网生态。为防御黑帽SEO行为,搜索引擎公司需要持续更新其算法。为此,DataCon组委会联合百度公司开设搜索引擎优化赛题,探索更安全的SEO技术。

在本挑战中,参赛者将在真实的百度搜索引擎中一展身手,运用你的SEO技巧和创意,将你的网页推向搜索结果的顶峰。我们鼓励参赛者探索和应用合法、有效的SEO策略,以提高网页在搜索结果中的排名。通过这场比赛,我们希望参赛者能够深入理解SEO的原理,充分掌握白帽搜索引擎优化(White Hat SEO)的技术原理与实战经验,同时认识到合法的SEO策略对于网站长期发展的重要性。 
该挑战最大的特色是,为参赛选手提供的是最真实的比赛环境,参赛选手直接在百度真实的搜索引擎业务场景中进行搜索优化挑战。与此同时,该挑战最大的困难也是来源于该赛题所在的真实业务场景。与虚拟仿真环境不同的是,百度的真实搜索环境对于选手来说是纯黑盒的,参赛选手页面的收录、搜索优化需要考虑的维度非常复杂,不仅包含大家已知的一些“规则”,同时还有一些业务上的“限制”需要考虑。
因此,该赛题考虑的是参赛选手的综合能力,整个赛题涉及创建域名、搭建网站、网站收录、搜索优化这四个主要的维度,因此不仅需要参赛选手充分了解搜索引擎优化的原理,还需要其具备基本的网络知识(比如搭建网站),同时还需要具有灵活的思维逻辑,尝试探索更佳的搜索优化方案。
请注意:本赛题要求选手提前准备好参赛所需使用的域名,并自行进行搜索引擎收录提交尝试,请注意域名格式具体要求详见赛题指南:
https://datacon.qianxin.com/competition/information-detail?informationId=32

出题人划重点

为帮助参赛选手熟悉赛题相关理论知识,出题团队成员@清华大学博士刘一静为大家带来报告《门票还是隐私?探究抢票软件的安全风险与用户意识》。由于黄牛倒票行为的普遍存在以及实名购票系统的推广,以用户驱动的移动抢票应用程序已成为目前主流的抢购模式。在本报告中,首次从应用开发者、软件使用者和抢购目标平台的综合角度,揭示抢票软件的生态系统。

视频较长,完整版视频请前往DataCon社区观看
社区链接:https://datacon.qianxin.com/video/video-list
出题团队成员@中关村实验室助理研究员刘明烜为大家带来报告《数据驱动的域名基础设施新型滥用行为研究》,其中讲述了黑帽SEO检测相关研究内容。
视频较长,完整版视频请前往DataCon社区观看
社区链接:https://datacon.qianxin.com/video/video-list

同时,出题团队为大家推荐9篇必读论文,赶快收藏学习吧。

1.Tickets or Privacy? Understand the Ecosystem of Chinese Ticket Grabbing Apps

2.Experience Report: System Log Analysis for Anomaly Detection

3.Logbert: Log anomaly detection via bert

4.Real World Implementation of LLM-based Log Anomaly Detection-Exploring the feasibility of training-free approaches

5.deSEO: Combating Search-Result Poisoning, USENIX Security 2011

6.Juice: A Longitudinal Study of an SEO Botnet, NDSS 2013

7.The Ever-Changing Labyrinth: A Large-Scale Analysis of Wildcard DNS Powered Blackhat SEO, USENIX Security 2016

8.How to Learn Klingon without a Dictionary: Detection and Measurement of Black Keywords Used by the Underground Economy, SP 2017

9.Into the Dark: Unveiling Internal Site Search Abused for BlackHat SEO, USENIX Security 2024

关注转发赢DataCon定制周边
关注DataCon公众号+分享本篇文章至朋友圈或网络安全相关社群可获得抽奖资格,即可赢取DataCon2024定制服饰。


分组、开奖前删除、开奖后转发均视为无效

部分图片来源网络,如有侵权联系删除


感谢合作伙伴的助力 让我们走得更高更远


点击"阅读原文"进入官网报名


文章来源: https://mp.weixin.qq.com/s?__biz=MzU5Njg1NzMyNw==&mid=2247488483&idx=1&sn=986a5c1d1694e4a8976c37a430c49975&chksm=fe5d0b63c92a82752da4012da5f1045abf506a097f116900bf7f6486052dde9ccb8ae3fd7fa8&scene=58&subscene=0#rd
如有侵权请联系:admin#unsafe.sh