提起搜索大数据在健康领域的应用,一定绕不开谷歌。2009年谷歌利用搜索关键词,成功地通过谷歌流感趋势追踪了H1N1的疫情。这种方法的思路是,假设人们搜索的特定的关键词,与他本人或周围亲朋的健康状况有关。这样,当人们搜索什么喉咙痛,流鼻涕之类的关键词时,系统就会认为这个人或其亲朋有可能受到流感困扰,如果短时间内某个区域有大量关于流感症状的搜索,那么该地区就很有可能存在对应的流感人群。
百度搜索也在积极进行这方面的尝试,这次的方向是艾滋病。当然,考虑到艾滋病和流感毕竟传播多有不同,并不能像流感那样得到很快很及时的趋势报告,但是我们仍然能够从搜索相关数据中发掘有用的信息。(以下数据来自国际艾滋日前三个月的数据。)
男人更关注艾滋病
在用电脑端搜索的用户里,有79.9%的男性和20.1%的女性,而在移动端则是73.1%的男性对26.9%的女性,看来女性可能更倾向于在私密性比较强的手机上搜寻相关内容。总的来说这个比例也比较近似实际生活中艾滋病毒携带者的性别比例——男性和女性比例约为7:3。考虑到我国网民性别比例为男:女=55:45(数据来自中国互联网络发展状况统计调查2014年版),可以认为在搜索用户中男性更关注艾滋病。
年轻人更关注艾滋病
在关于艾滋病的搜索中,10岁到29岁年轻人占到了88.25%,粗略对比我国网民年龄分布,10岁到29岁年轻人的比例只占55%左右(数据来自中国互联网络发展状况统计调查2014年版),可见,确实这个年龄段的用户更容易搜索艾滋病。而且20-29岁年龄段的年轻人,确实性活动比较活跃。
学历分布
本科及本科以下的人群,在艾滋病相关搜索中贡献了86.31%的搜索量。而这些人群在搜索艾滋病相关问题的前后,也会搜索网游、玄幻、网络小说、ACG等内容,因此,在这类内容的平台上投放相关资料和公益广告也许更能够触及这些群体。职业分布
搜索艾滋病的人群中什么职业最多呢?看了前边年龄啊学历那些数据,想必你会脱口而出:学生!没错,来自学生的搜索占到了51.31%。接下来的,是广告·营销·公关大类,占了9.19%,接下来则是互联网、旅行、保险房产金融、电信网络、医疗保健服务等。
地域分布
Top10是广东、江苏、浙江、山东、四川、上海、北京、河南、福建、河北,不过需要指出的是,这只代表各地对艾滋病相关问题的搜索次数,并不能代表艾滋病的疫情分布。根据国家疾控中心2010年的数据,云南、广西、河南、四川、新疆和广东这六省的感染者和病人数占了全国总数的77.1%。这种差异可能跟网络发达程度和艾滋病相关的科普教育差异有关。
他们都搜了些什么?
令人不安的是,在搜索的关键词列表里,top10中,除了“艾滋病”这三个字之外,绝大部分都是和“艾滋病早期症状”以及艾滋病最新疗法有关。而百度知道的数据则印证了这一点,top5的问题中,艾滋病初期症状排名第一,接下来是关于艾滋病预防和传染的问题。这可能意味着,很多搜索者是怀着一种担心来寻求验证。根据以上数据,我们能发现学生是对艾滋病非常关注的一个群体,那么现实中是怎么样的呢?
根据国家疾控中心的数 据,2014年,我国新报告的学生艾滋病病例 2917例,比2008年的779例增长了270%,远远高于平均增长速度。而2015年1-10月份共报告2662例学生感染者和病人,比去年同期增加27.8%。在性别方面,在2008年,在新报告学生病例中,男女生的比例是9:1,而到2014年是41:1。
如此看来,互联网将是向这些群体传播艾滋病预防知识最适合的阵地。而通过优化健康、科普领域的搜索体验,加大力度在搜索平台上宣传靠谱的抗艾知识,能够有效覆盖相当数量的重点人群。甚至,我们能够通过大数据为疾控中心等国家疾控中心等机构提供更好的决策支持,让大家一起行动起来,向零艾滋迈进。