對(duì)于第三方數(shù)據(jù)公司來說,仿佛一夜入冬了。 近期,數(shù)據(jù)圈接連傳出重磅消息。先是魔蝎科技、新顏科技被爆遭到調(diào)查,然后公信寶運(yùn)營主體杭州存信數(shù)據(jù)科技有限公司(下稱存信數(shù)據(jù))也被杭州市公安局西湖分局古蕩派出所查封。 而且這可能只是開始,本次監(jiān)管部門
對(duì)于第三方數(shù)據(jù)公司來說,仿佛一夜入冬了。
近期,“數(shù)據(jù)圈”接連傳出重磅消息。先是魔蝎科技、新顏科技被爆遭到調(diào)查,然后公信寶運(yùn)營主體——杭州存信數(shù)據(jù)科技有限公司(下稱“存信數(shù)據(jù)“)也被杭州市公安局西湖分局古蕩派出所查封。
而且這可能只是開始,本次監(jiān)管部門對(duì)打擊違法獲取和使用信息的大數(shù)據(jù)公司的決心很大。北京一家數(shù)據(jù)科技公司研發(fā)部負(fù)責(zé)人劉毅(化名)告訴《華夏時(shí)報(bào)》記者:“公司已經(jīng)放假了,何時(shí)上班十一后等通知。其他一些公司也提前放假了,沒放假的也在停工觀望,現(xiàn)在監(jiān)管部門對(duì)提供爬蟲服務(wù)的數(shù)據(jù)公司整治力度空前的大。”
而對(duì)于目前“數(shù)據(jù)圈”存在的亂象,中信集團(tuán)原監(jiān)事長、中信銀行原行長朱小黃在“2019中國銀行業(yè)發(fā)展論壇智慧金融(上海)峰會(huì)”上指出,好多數(shù)據(jù)公司都是“爬”下來的數(shù)據(jù),當(dāng)然成本低,數(shù)據(jù)公司利用了這個(gè)成本低的優(yōu)勢(shì),迅速的獲得收益。這種建立在侵犯個(gè)人、企業(yè)數(shù)據(jù)下形成了一個(gè)商業(yè)模式使行業(yè)產(chǎn)生了異化。
在近年互聯(lián)網(wǎng)金融大潮中,大數(shù)據(jù)服務(wù)供應(yīng)商一直扮演著重要角色。而近期多家公司接連被查,將處于數(shù)據(jù)風(fēng)控服務(wù)核心的網(wǎng)絡(luò)爬蟲技術(shù)推到了風(fēng)口浪尖。
爬蟲作為一種計(jì)算機(jī)技術(shù),具有技術(shù)中立性,爬蟲技術(shù)在法律上從來沒有被禁止。爬蟲的發(fā)展歷史可以追溯到20年前,搜索引擎、聚合導(dǎo)航、數(shù)據(jù)分析、人工智能等業(yè)務(wù),都需要基于爬蟲技術(shù)。但是爬蟲作為獲取數(shù)據(jù)的技術(shù)手段之一,由于部分?jǐn)?shù)據(jù)存在敏感性,如果不能甄別哪些數(shù)據(jù)是可以爬取,就會(huì)觸及監(jiān)管紅線。
“爬蟲技術(shù)作為第三方大數(shù)據(jù)風(fēng)控服務(wù)商的主打產(chǎn)品,也是互聯(lián)網(wǎng)金融公司進(jìn)行大數(shù)據(jù)風(fēng)控必不可少的武器。”劉毅對(duì)記者說,“不過,目前網(wǎng)絡(luò)爬蟲存在著是否經(jīng)過用戶授權(quán),是否存在過度爬取信息,爬取到的信息使用等問題。隨著同業(yè)競爭越來越激烈,一些畸形的爬蟲產(chǎn)品也隨之出現(xiàn),涉及數(shù)據(jù)竊取、泄露、濫用和隱私安全等問題。”
一些大數(shù)據(jù)風(fēng)控服務(wù)商為了在競爭中取得領(lǐng)先地位,需要更**的分析用戶行為,制作用戶畫像,為了獲取海量的數(shù)據(jù)支撐,電商數(shù)據(jù)、通信運(yùn)營商、出行數(shù)據(jù),信用卡、人行征信等信用數(shù)據(jù),甚至網(wǎng)銀、公積金等金融數(shù)據(jù)等,都成為爬蟲們的目標(biāo)。
據(jù)劉毅介紹, 市場(chǎng)上曾經(jīng)有一款專門爬取支付寶數(shù)據(jù)的產(chǎn)品。只需要用支付寶掃描一下登錄“二維碼”,就可爬取支付寶用戶的真實(shí)姓名、手機(jī)號(hào)、收貨地址、近一年的購物信息、交易記錄等。而一家第三方大數(shù)據(jù)風(fēng)控服務(wù)商曾在市場(chǎng)上推出的一款“同業(yè)爬蟲”產(chǎn)品更厲害,只需要用戶提供其在其他現(xiàn)金貸平臺(tái)的賬號(hào)和密碼,就可以爬取用戶的所有信息,包括放款額和風(fēng)控?cái)?shù)據(jù)。放款機(jī)構(gòu)可以根據(jù)這些數(shù)據(jù)進(jìn)行評(píng)估,實(shí)現(xiàn)“秒批”和“秒放”。這個(gè)產(chǎn)品相當(dāng)于直接掠奪同業(yè)數(shù)據(jù),竊取別人的風(fēng)控成果。由于過于野蠻粗暴,被業(yè)內(nèi)成為“耍流氓”。
“只要技術(shù)好,就沒有爬不到的數(shù)據(jù)。”劉毅總結(jié)道。
“一些第三方大數(shù)據(jù)風(fēng)控服務(wù)商利用爬蟲技術(shù)違法獲取或過度獲取用戶信息并使用的行為,已經(jīng)成為阻礙行業(yè)健康發(fā)展的瓶頸。而個(gè)別公司打著金融創(chuàng)新的幌子,就是為了突破監(jiān)管的要求。無論公司發(fā)展的規(guī)模多大,違規(guī)獲取和使用數(shù)據(jù)的行為都是不可能回避的‘原罪’。”一位不具姓名的金融業(yè)人士向本報(bào)記者指出。
提高自主風(fēng)控能力
事實(shí)上,對(duì)大數(shù)據(jù)公司獲取和使用用戶信息的行為并非無法可依。
早在2017年6月1日,《網(wǎng)絡(luò)安全法》正式施行,比如第四十一條規(guī)定,網(wǎng)絡(luò)運(yùn)營者收集、使用個(gè)人信息,應(yīng)當(dāng)遵循合法、正當(dāng)、必要的原則,公開收集、使用規(guī)則,明示收集、使用信息的目的、方式和范圍,并經(jīng)被收集者同意;第四十四條規(guī)定,任何個(gè)人和組織不得竊取或者以其他非法方式獲取個(gè)人信息,不得非法出售或者非法向他人提供個(gè)人信息。
而在2019年5月28日**互聯(lián)網(wǎng)信息辦公室發(fā)布的《數(shù)據(jù)安全管理辦法(征求意見稿)》也明確出現(xiàn)了對(duì)網(wǎng)絡(luò)爬蟲規(guī)制的法律條文。其中第十五條規(guī)定,網(wǎng)絡(luò)運(yùn)營者以經(jīng)營為目的收集重要數(shù)據(jù)或個(gè)人敏感信息的,應(yīng)向所在地網(wǎng)信部門備案。備案內(nèi)容包括收集使用規(guī)則,收集使用的目的、規(guī)模、方式、范圍、類型、期限等,不包括數(shù)據(jù)內(nèi)容本身;第二十條表示,網(wǎng)絡(luò)運(yùn)營者保存?zhèn)€人信息不應(yīng)超出收集使用規(guī)則中的保存期限,用戶注銷賬號(hào)后應(yīng)當(dāng)及時(shí)刪除其個(gè)人信息;第二十七條指出,網(wǎng)絡(luò)運(yùn)營者向他人提供個(gè)人信息前,應(yīng)當(dāng)評(píng)估可能帶來的安全風(fēng)險(xiǎn),并征得個(gè)人信息主體同意。
目前,隨著“數(shù)據(jù)圈”亂象整治的深入,一些公司紛紛對(duì)業(yè)務(wù)進(jìn)行調(diào)整。其中,上海一家信息科技公司干脆發(fā)公告給合作商戶稱,暫停對(duì)外提供用戶授權(quán)的運(yùn)營商爬蟲服務(wù),擁抱監(jiān)管、加強(qiáng)自律。
公開信息顯示,本次被調(diào)查的公司大多是國內(nèi)較早從事大數(shù)據(jù)智能解決方案的服務(wù)商。主要為銀行、保險(xiǎn)、消費(fèi)金額公司、貸款機(jī)構(gòu)等提供智能風(fēng)控、風(fēng)險(xiǎn)分析、信用分析、多頭借貸、風(fēng)控建模等風(fēng)控技術(shù)解決方案,合作機(jī)構(gòu)多達(dá)數(shù)千家。
上述金融業(yè)人士也向本報(bào)記者表示,嚴(yán)格監(jiān)管對(duì)于行業(yè)的長遠(yuǎn)發(fā)展起到了積極作用。隨著強(qiáng)監(jiān)管信號(hào)的不斷釋放,野蠻生長的大數(shù)據(jù)收集時(shí)代將結(jié)束。這對(duì)很多風(fēng)控公司、征信公司以及金融機(jī)構(gòu)都會(huì)受到深遠(yuǎn)的影響。
那么,對(duì)于金融等機(jī)構(gòu)來說,這些民營第三方數(shù)據(jù)供應(yīng)商,真的無可替代了嗎?其實(shí),早在2014年初,北京中關(guān)村就成立了樹海大數(shù)據(jù)交易平臺(tái),
石家莊網(wǎng)站建設(shè)消息2015年4月****個(gè)大數(shù)據(jù)交易所在貴陽掛牌運(yùn)營;同年7月底,武漢東湖大數(shù)據(jù)交易中心開業(yè)。此外,江蘇、浙江等省份也籌建了自己的大數(shù)據(jù)交易中心或交易所。
河南一家城商行的高管告訴本報(bào)記者:“這些**性質(zhì)的數(shù)據(jù)交易所或交易平臺(tái),受到的**管控較強(qiáng),其數(shù)據(jù)確實(shí)非常合規(guī),但由于來源渠道受限,對(duì)于金融機(jī)構(gòu)來說在實(shí)際應(yīng)用中效果不大。”
不過,對(duì)于金融機(jī)構(gòu)來說,在有限的數(shù)據(jù)下做好風(fēng)控是未來必須面對(duì)的問題。前述金融業(yè)人士認(rèn)為,事實(shí)上,此前一些金融機(jī)構(gòu)的風(fēng)控工作,主要是靠引入數(shù)據(jù)供應(yīng)商,反倒是自身的風(fēng)控水平出現(xiàn)下滑。另外,數(shù)據(jù)資源太多也不一定是好事,會(huì)導(dǎo)致很多金融機(jī)構(gòu)貸前審核不認(rèn)真,降低了準(zhǔn)入門檻,讓很多還款能力弱、還款意愿不強(qiáng)的用戶通過了審核,**金融機(jī)構(gòu)只好通過加大貸后催收力度的辦法迫使其還款,這又衍生出暴力催收的問題。
斷掉第三方數(shù)據(jù)供應(yīng)商違規(guī)獲取的數(shù)據(jù)后,金融機(jī)構(gòu)只能扎扎實(shí)實(shí)地開展貸前審核工作,讓真正**的、有技術(shù)能力的企業(yè)凸顯出來。
在這次整治數(shù)據(jù)亂象中,9月17日,第三方智能風(fēng)控與分析決策服務(wù)供應(yīng)商同盾科技實(shí)控人兼CEO 蔣韜在公開信中表示,人工智能及大數(shù)據(jù)這個(gè)行業(yè)是個(gè)新領(lǐng)域,這個(gè)新領(lǐng)域是需要所有從業(yè)者一起努力,在競爭的過程中互相學(xué)習(xí),共同幫助和配合監(jiān)管機(jī)構(gòu),逐步建立起這個(gè)行業(yè)的**實(shí)踐以及規(guī)制。
盡管監(jiān)管部門對(duì)數(shù)據(jù)公司整治力度空前,但不可否認(rèn)的是,大數(shù)據(jù)市場(chǎng)未來發(fā)展前景仍十分廣闊,是當(dāng)之無愧的藍(lán)海。
國內(nèi)的大數(shù)據(jù)產(chǎn)業(yè),眼下已經(jīng)進(jìn)入了快速發(fā)展時(shí)期,政府、通信和金融領(lǐng)域,已經(jīng)成為了大數(shù)據(jù)技術(shù)落地的重點(diǎn)。其中,銀行、保險(xiǎn)、證券與投資,是整個(gè)金融領(lǐng)域的重要組成部分。面對(duì)日益龐大的金融資金交易量、日益嚴(yán)峻的網(wǎng)絡(luò)黑客攻擊形勢(shì),金融機(jī)構(gòu)積極轉(zhuǎn)變思維方式,并嘗試?yán)么髷?shù)據(jù)、云計(jì)算等技術(shù)來構(gòu)建防火墻,進(jìn)一步提升金融交易的安全性。而居于首要位置的大數(shù)據(jù)分析技術(shù),在風(fēng)控、信貸、金融反欺詐等方便有著先天優(yōu)勢(shì)。
具體來說,利用大數(shù)據(jù)技術(shù),銀行等金融機(jī)構(gòu)的工作人員可以對(duì)貸款的目標(biāo)客戶進(jìn)行資信評(píng)估。通過對(duì)某家企業(yè)的生產(chǎn)數(shù)據(jù)、電水消耗、工資水平、訂單數(shù)量、投資偏好、研發(fā)投入、產(chǎn)品周期等進(jìn)行***的分析,評(píng)估人員能夠較為客觀地了解企業(yè)的實(shí)際運(yùn)營狀況,進(jìn)而決定是否放貸及放貸的金額。
值得一提的是,新技術(shù)的產(chǎn)生,往往伴生出新的生產(chǎn)方式和商用模式。大數(shù)據(jù)在金融領(lǐng)域的應(yīng)用,不僅對(duì)原有的金融交易信息采集方式造成一定的沖擊,也促使出現(xiàn)新型的數(shù)據(jù)信息收集、整合和分享方式。隨著大數(shù)據(jù)健康發(fā)展,許多行業(yè)的用戶開始建立數(shù)字化云平臺(tái),以此為企業(yè)生產(chǎn)、銷售等信息的統(tǒng)計(jì)和匯總提供便利。
咨詢機(jī)構(gòu)IDC**發(fā)布的報(bào)告預(yù)測(cè),2019年,大數(shù)據(jù)與商業(yè)分析解決方案全球市場(chǎng)的整體收益將達(dá)到1896.6億美元(約合人民幣13495.1億元),這一數(shù)字相比2018年增長12.1%。在2019年—2023年的預(yù)測(cè)期內(nèi),全球大數(shù)據(jù)市場(chǎng)相關(guān)收益將實(shí)現(xiàn)13.1%的復(fù)合年均增長率,并預(yù)計(jì)總收益在2023年達(dá)到3126.7億美元。
未來5年,由于政策支持以及多方技術(shù)融合,中國大數(shù)據(jù)市場(chǎng)將保持穩(wěn)定增長。該機(jī)構(gòu)預(yù)測(cè),2019年中國大數(shù)據(jù)市場(chǎng)總體收益將達(dá)到96億美元,2019年—2023年預(yù)測(cè)期內(nèi)的復(fù)合年均增長率為23.5%,增速高于全球平均水平。到2023年,市場(chǎng)規(guī)模則將增長至224.9億美元。從技術(shù)上看,大數(shù)據(jù)相關(guān)硬件在2019年中國整體大數(shù)據(jù)市場(chǎng)中占比**,達(dá)到45.2%;大數(shù)據(jù)相關(guān)服務(wù)支出和軟件收益的占比則分別為32.2%和22.6%。而到2023年,隨著技術(shù)的成熟與融合以及數(shù)據(jù)應(yīng)用和更多場(chǎng)景的落地,軟件規(guī)模占比將逐漸增加,服務(wù)相關(guān)收益占比保持平穩(wěn)發(fā)展的趨勢(shì),而硬件規(guī)模在整體的占比中則逐漸減小。硬件、服務(wù)、軟件三者的比例將更為相似,逐漸趨近于各占三分之一的權(quán)重。
而從行業(yè)上看,2019年中國大數(shù)據(jù)與商業(yè)分析解決方案市場(chǎng)中收益前三的行業(yè)依次是金融、政府、通信,三者總和占中國市場(chǎng)總額的50%以上。在金融行業(yè),大數(shù)據(jù)分析技術(shù)賦能于金融反欺詐、風(fēng)控、信貸業(yè)務(wù)等業(yè)務(wù)。