0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大数据解决方案如何实施

jf_71740937 来源:jf_71740937 作者:jf_71740937 2025-12-25 18:22 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

大数据解决方案实施的难点在于以下几点:

1.很少有优质可用的数据

在数聚股份看来,这几年数据交易机构如雨后春笋,“数据变现”成为很多拥有数据积累的传统企业的新的生财法。目前,我国大数据需求端以互联网企业为主,覆盖面不广,在O2O趋势下,大型互联网厂商尝试引入外部数据支撑金融、生活、语音、旅游、健康和教育等多种服务。

然而在具体的领域或行业内,我国普遍未形成成型的数据采集、加工、分析和应用链条,大量数据源未被激活,大多数数据拥有者没有数据价值外化的路径。比如,各医疗健康类应用收集了大量的数据,但没有像那样面向医药公司售卖数据。与国外相比我国的政府、公共服务、农业应用基本缺位,电信和银行业更缺少与外部数据的碰撞。

另外,其实数据交易这件事本身就是一个悖论。数据作为一种商品有一定的特殊性,我用了别人也可以用,没有任何消耗,可以在市场卖很多遍。这就产生一个问题,你这个数据到市场卖,根据经济学观点它的价值是零,你卖给我我可以用更低的价格卖给别人,所以数据交易理论上来说也是不可行的。

大数据概念火了以后,很多机构觉得数据存起来就是宝,于是积攒了大量零碎数据放在那里,到底能发挥什么作用也未可知。而在和许多真正想用数据做些事情的机构的合作中我们发现,即便是政府机构这样的权威数据持有方,也存在很多数据缺失、数据错误、噪音多各方面的问题。

我们常常在讲大数据就用大数据方法,小数据就用小数据方法,完美的数据是永远等不来的。但这样会导致什么问题呢?在实际项目实施过程中,我们的数据科学家们不得不花费大量时间在数据清洗上,这其实是对本来就紧缺的数据人员的一种浪费。

理论上我们中国有很多数据,但不同部门数据存在在不同的地方,格式也不一样。政府内部本身整合各部门的数据就已经是一件很头大的事情,更不要提大规模的数据开放。同时数据开放面临一个严重问题就是隐私问题,脱敏远远不够,隐私问题是一个无底洞。比如我们把一个人的支付宝3个月数据拿过来,就可以很轻易的知道这个人今天在门口便利店买了一瓶水,昨天在淘宝买了沙发,每隔三个月会有一笔万元的支出。那我们就可以很容易推断这个人刚换了一个租房子的地方,就能了解他的消费习惯。这个数据其实完全是脱敏的,没有名字、没有号码,但丝毫不妨碍我们通过算法完全的勾勒出这个人的画像。

2.实际技术与业务之间还有很大距离

在数聚股份看来,大数据行业发展至今,技术与业务之间依然存在巨大着鸿沟。首先,就是数据分析技术本身。数据源企业为实现数据价值变现,尝试多种方法,甚至自己组建数据分析团队,可是数据分析是个技术活,1%的误差都会极大地影响市场份额,术业有专攻,数据变现还是需要专业的数据分析人才来实现。

大数据概念的火热,做大数据的公司越来越多,产品做得五花八门,数据建模看似谁都可以涉足,但现在数据分析的技术,方法,模型,算法都有了非常大的改进,跟过去六七十年代完全不一样,不是说做几个SAAS软件或者RAAS软件就是大数据了,虽然短期看市场火热,但长远来说这条路是走不通的,大数据行业发展,技术才是真正的发力点,提高行业准入门槛尤为重要。

其次中国的数据有它的特色,例如在金融行业,目前大部分银行采用的是风险评分卡,运用专家经验定义风险变量,基于定性认识进行评分,通过事后风险回检优化评分卡,风险预警功能较差。虽然央行征信中心与国内少数技术领先银行使用的是风险评分模型,但模型方法相对陈旧,如央行所用FICO评分模型为上世纪80年代基于逻辑回归算法构建的评分体系,逻辑回归算法适合处理线性数据,但实际问题往往是非线性的,特别是信用风险评估场景下。此外,FICO模型没有针对我国具体业务进行场景细分,建模逻辑并不完全符合我国实际情况,因此导致准确率不足,风险预警能力差。基于此,中国人民银行征信中心首次与国内大数据公司合作,这次合作中普林科技应用国际领先的大数据建模分析技术运用决策树随机森林,AdaBOOST,GBDT,SVM等算法,通过对信用报告的数字化解读与深入洞察,准确预测了违约风险,对贷款审批、贷中管理形成指导,新模型对好坏账户的区分度远高于行业平均水平。此次合作表明我国的大数据难题更需要适应国情的解决方案与本土的技术人才,这对我们的市场提出了一个新问题。

3.人才稀缺

在数聚股份看来,我们国家大数据发展最大的优势就是市场大,最大的劣势恰巧就是缺乏相应人才,人才缺乏的程度非常严重。首先在国际市场方面,我们要跟国外公司争人才,然而国外大数据行业同样十分火热。而不论在国内还是国外,跟企业竞争人才都是一项艰巨的事业,比如在世界上最好的大学之一的美国普林斯顿大学,想找数学家也是非常困难,人才很容易被大公司挖走,每年都有非常好的数据分析人才被企业挖走。所以人才难觅不只是口头说说,更是一个亟待解决的问题 大数据是一个交叉学科,涉及统计学,管理编程等多学科,知识点复杂,缺乏系统的学习教程。


审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 大数据
    +关注

    关注

    64

    文章

    9102

    浏览量

    144113
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    ROS2 如何打通仿真与数据匿名化?#人工智能 #机器人 #大数据 #产品方案

    大数据
    康谋keymotek
    发布于 :2026年05月07日 16:55:44

    黑M-狂野大数据5期|网盘无密Mp4+大数据直播课-狂野大数据

    科技重构数据生产力:狂野大数据直播实战全解析 随着数字化时代的快速发展,大数据已经渗透到我们生活的方方面面。无论是商业、教育,还是医疗、政府服务,大数据的应用都在不断创造新的价值。而在
    的头像 发表于 04-06 11:13 241次阅读

    海光3350便携机主板:大数据处理利器

    随着企业数字化转型加速,大数据处理需求从固定机房向移动场景延伸。无论是金融机构外出调研、科研团队野外数据采集,还是个人创作者处理海量素材,便携设备的性能成为关键。海光便携机主板凭借独特的技术优势,正成为大数据处理领域的“移动
    的头像 发表于 12-26 11:15 732次阅读

    低功耗物联网农业气象监测系统设计与实施方案

    物联网农业气象监测系统方案是基于物联网、大数据、人工智能等技术,针对农业生产对气象环境的核心需求,构建的“全域感知-智能传输-精准分析-主动报警-协同管控”全流程解决方案。其核心目标是解决传统农业
    的头像 发表于 12-23 16:37 401次阅读

    大数据平台运营的基础是什么

    在数聚股份看来,越来越多的企业开始搭建自己的大数据平台体系,并倾注大量资源用于平台的迭代和运营。那么大数据平台作为越来越被关注的企业新兴价值点,它应该以何种方式看待,并且以什么样的方式去建设和运营
    的头像 发表于 12-23 16:07 388次阅读

    Amphenol LTW:数据中心互连解决方案的创新先锋

    Amphenol LTW:数据中心互连解决方案的创新先锋 在当今数据驱动的时代,数据中心的高效运行至关重要。Amphenol LTW作为一家专注于为恶劣环境提供卓越互连
    的头像 发表于 12-10 09:30 1064次阅读

    东软集团领跑中国医疗大数据解决方案市场

    近日,国际数据公司(IDC)权威发布《中国医疗大数据解决方案市场份额,2024:全域数据支撑》(Doc#CHC53739825,2025年9月)报告。报告显示,在中国医疗
    的头像 发表于 10-30 17:09 857次阅读

    软通动力携手华为推出智帷司库解决方案

    华为全联接大会2025中,软通动力联合华为正式发布了深度融合华为GaussDB高性能企业级数据库的解决方案——软通动力智帷司库解决方案方案以“行业最佳实践+一体化平台+强大
    的头像 发表于 09-28 17:41 1693次阅读

    御控工业物联网大数据解决方案:排水设备远程监控与大数据统计系统

    御控工业物联网推出排水设备远程监控与大数据统计系统,通过物联网、大数据、云计算等技术构建“感知-传输-分析-决策”闭环管理体系,助力排水行业数字化转型。
    的头像 发表于 09-12 10:04 834次阅读

    软通动力数据库专业服务全栈解决方案亮相2025数博会

    8月28日,2025中国国际大数据产业博览会(数博会)在贵阳开幕,软通动力携数据库专业服务全栈解决方案亮相盛会,全面展示从数据库迁移部署、性能优化、容灾备份到智能运维的全生命周期服务能
    的头像 发表于 09-04 09:32 1018次阅读
    软通动力<b class='flag-5'>数据</b>库专业服务全栈<b class='flag-5'>解决方案</b>亮相2025数博会

    电科网安亮相2025中国国际大数据产业博览会

    安全及信创领域相关产品及方案亮相中国电科展台,重点展示了数据安全监测平台、数据安全统一管理解决方案、信创整体解决方案,吸引众多参展来宾驻足观
    的头像 发表于 08-30 11:39 1853次阅读

    封闭式园区安全管控解决方案应该如何实施

    封闭式园区安全管控解决方案实施是一项系统工程,涉及前期规划、设备部署与系统搭建、人员培训等多个环节
    的头像 发表于 08-20 11:08 885次阅读
    封闭式园区安全管控<b class='flag-5'>解决方案</b>应该如何<b class='flag-5'>实施</b>?

    冲压PLC类设备的数据采集解决方案

    冲压PLC类设备的数据采集解决方案,结合低成本实施策略与深控免点表网关的应用设计
    的头像 发表于 08-07 11:21 994次阅读
    冲压PLC类设备的<b class='flag-5'>数据采集解决方案</b>

    软通动力携手华为云推出AI知识引擎与数据工程融合创新解决方案

    在华为开发者大会2025中,软通动力携手华为云以华为云昇腾AI、盘古大模型、ModelArts等为技术底座,全新升级数据治理基线解决方案,正式发布AI知识引擎与数据工程融合创新解决方案
    的头像 发表于 06-28 17:07 1816次阅读

    艾默生 SolaHD 通过 \"从地板到云端™\"解决方案和在线产品配置器推进电能质量管理

    备先进的诊断功能。这一坚实基础可与云端系统实现无缝对接,使企业能够灵活扩展运营规模、获取实时数据分析,并快速适应不断变化的市场需求。 SolaHD\"从设备层到云端™\"解决方案
    发表于 06-10 14:50