知乎上有一则提问,叫“如何评价高春辉?”除了清一色地肯定和赞许,就是对他当下所做IPIP的感慨:这些年还能沉下心来踏踏实实干那么苦的IP库的事儿,光凭这一点就令人佩服。 的确,IP库是一件很苦的事,苦在哪里——难。 首先,当前中国(含港澳台)的IP地址数据已经超过 4 亿,如何找到合适的角度切入,如何使用数据,如何分配,这当中的规律又是什么,这就是第一难。 其次,对于IP地址和GPS坐标之间的对应关系这一非公开数据的获取,需要从用户的家庭宽带、数据中心、基站、网络特点等各个维度进行划分和理解,并做出针对性的分析和处理。怎么做,这是第二难。 最后,当所有的IP地址都整理完毕后,面对如此庞大的数据量,保持及时的更新和维护,更是难上加难。尤其在经历了每一个法定假日之后,数据都可能会发生翻天覆地的变化,如果不能长期处于加班和精神高度紧绷的状态,不仅无法及时更新,数据还会面临失控的可能。 因此,这三“难”就成了做IP库很苦的原因。 高春辉说,目前IPIP.NET的文本共有超过 584 万,理论上这要比 584 万行代码还要复杂。因为代码的逻辑存在于代码本身,但这 584 行文本数据,只有结果,没有逻辑。想要搞清楚这 584 万行的数据有没有误差,就需要首先搞清楚这 584 万行数据背后的逻辑。 要知道,IP地址是不允许有错的,因为商用场景下,IP地址与业务直接关联,某一个地址的细小误差,就可能在用户侧产生极大的偏离。 从 2016 年开始,IPIP已经完成了全部国内IP数据的采集和整理工作,并将业务范围延伸到了海外。数据量的激增以及业务范围的扩大,让高春辉不得开始不重视人才引进。但在IP库这个领域,此前并没有所谓“有经验积累”的人才,招人也就变成了新的难题。 高春辉回忆,自己甚至曾面试过食品安全这类专业完全不相干的新人,因为在但凡科班出身的人眼中,做任何其他的事都可能比维护IP库更能实现个人价值。因此IPIP不得不克服周期冗长的困难,从零开始培养人才。 不过,如果说IP数据的准确性可以通过不断地迭代更新予以改进,人才也可以一步一个脚印培养得原来越好,那么另一个问题恐怕就更像是一门高深的学问了,那便是“政治问题”。 “维基百科”上有一个词条,叫“有限承认国家列表”,包括“中国台湾”在内,这个词条里竟然罗列了超过 100 个国家和地区。要知道,截至 2019 年,全世界一共现有 233 个国家和地区,这里面竟然就占据了1/2。 所以,同一个国家和地区,站在不同的立场上,就会对归属问题有不同的理解和判断。一旦IP地址触及了不同的立场,那就会变成“政治问题”。 高春辉告诉我,最新版本的IPIP文本已经超过了 1 个G,包含了国家、地区、省市、城市、运营商所有者、GPS坐标、国家代码、州代码、电话区号等在内的 23 个字段。并且专门针对广告业务设置了不同的时区和令时,针对电商业务梳理了相对的货币符号。 可以说,除了拉美和非洲部分地区尚在推进阶段以外,全球所有的IP地址基本整理完毕。 而对于数据的维护,IPIP始终坚持着全量更新的原则,并且保持着每日滚动更新的频率。在高春辉看来,这不只是对客户的负责,也是对自己第六次创业的认真态度。因为也许,这会是他最后一次创业。 为什么IPIP能做得更好 中国有句老话,叫“文无第一,武无第二”。当然,这句话放在技术圈里也同样适用。 (责任编辑:admin) |