“网络爬虫”——财务和老板都害怕的事情终于

来源:中国税务报 作者:中国税务报 人气: 发布时间:2022-08-10
摘要:从2014年开始,企业会计们议论比较多的话题,就是: 税务机关纳税评估 系统有了, 金税三期 落地了, 税务稽查系统 什么时候会出来?人们从不同的角度猜测着税务稽查软件系统的功...

从2014年开始,企业会计们议论比较多的话题,就是:税务机关纳税评估系统有了,金税三期落地了,税务稽查系统什么时候会出来?人们从不同的角度猜测着税务稽查软件系统的功能和强大性。

近期有消息报道:税务稽查网络种植的爬虫已经开始按照税务稽查制定的方向抓取风险企业疑点,效果达到了预期的要求。企业老总和财务人员担忧的事情终于在大数据时代进入了企业,这是税务机关监控和征收管理的又一把利剑,它就是税务稽查监控网络体系中种植的“爬虫”。

税务稽查在纳税评估的基础上开发的网络爬虫(又被称为网页蜘蛛,网络机器人、网页追逐者),其功能就是按照一定的规则和分析目的,自动地抓取互联网+税收的程序或者脚本,以此获取纳税人经营活动的信息,作为验证纳税人法律遵从度和申报的真实性。

 

 

税务稽查网络爬虫在干什么?

税务稽查网络爬虫强大的功能就在于它完全是按照税务稽查所下达查验的方向指令进行行动,这些爬虫可以很快的按照税务稽查的要求抓取到税务稽查人员所要的分析结果和反映出纳税人涉税异常点。

爬虫强大的功能是什么?

一是拓展信息渠道,将网络'爬虫'技术引入涉税信息的采集,对外部网站披露的与企业资本运作活动有关的信息适时捕捉,丰富案源线索;

二是精准工作定位,将风险方向定位在股权投资和土地、房屋等大额资产的处置上,分析方法和指标设计针对性强;(今后会快速延伸到其它环节)

三是融合多方信息,引入了税务登记、申报、鉴证报告、财务报表、地税印花税等多方信息作为信息分析的主要着力点;

四是强化信息的挖掘应用,软件着重建立了各类信息源之间的对应关系和勾稽关系,用以支持风险的推定和排查;

五是风险信息重构,对多个投资方信息进行整理归纳,形成控制关系网络架构图,将复杂的资本运作行为重构还原为清晰的交易轨迹,以准确定位和发现这些交易中的税收风险。

 

看到以上税务稽查新的措施,大家有可能会感到惊悚。其实,利用社会媒介公开的信息,用于分析和抓取纳税人经济活动痕迹以此验证纳税申报的真实性这种逻辑分析方法,早在10年前就已经在采用了。

例如:某税务机关在社会媒体公开报道中看到一条新闻,大致意思是:XXX影视艺术文化公司公司投资拍摄电视剧XXXXX,创下国内电视剧之最,后期又投资拍摄了甲、乙两部电视剧......

这篇报道大家看了也就觉得是一个新闻而已。但是,这篇报道在税务机关信息源中,那就是一个彰显这个影视公司的经济效益。试想一想,该企业投资一部电视剧创下国内电视剧之最,紧接着又拍了两个电视剧,从资金运作的逻辑上分析,该企业第二次投资两个新的电视剧必须是第一部赚了钱,有了不错的利润,才会有资金又连续投资两个新的电视剧。

所以,根据这一信息,税务机关对该企业纳税申报进行了分析核查,发现该企业一直以来财务报表利润数据都反映的是亏损,这样的财务数据显然是与新闻报道中信息出现了疑点,既然亏损,那怎么可能有钱又紧接着投资了两部新电视剧?那当然,也可能是有新的股东投资、或者企业外借款、或者有人赞助等资金来源,那就查查看吧,结果追踪检查企业财务账务,该企业并没有新的股东投资,也没有外借资金,更没有资金赞助或者捐赠等行为,也就是说没有任何资金流入企业。这就奇怪了,没资金怎么两部新的电视剧拍出来了,往来账也没有欠款啊(赊账)?根据疑点最终检查出该企业利用收入不入账的手法逃逸税收,而且偷税数额占当年度应纳税额的比例均在30%以上。

随着网络的迅速发展,互联网成为大量信息的载体,而且人们对互联网的依赖已经达到了每日没水可以,每日没有网络不行。人们被网络绑架了。人们已经习惯利用网络在最短的时间里抓取自己需要的信息,而且这种习惯时时刻刻,无时不在的融入在每个人的生活、工作等多方面之中。当我们在寻找信息或在做推介时,也在利用网络输入自己的信息,一来一往,就在网络中留下了诸多的痕迹,被社会共享。

 

 

就如去年我去一家集团企业做营改增业务调查,闲聊中,我问道:您企业营改增之前属于地税管理,现在要移交国税管理,账面如果存在涉税问题,现在是一个纠正的机会。

财务回答:我们的账一点问题都没有,这么大的集团企业,而且做了几十年了,绝不会有涉税问题。

看着他很坚决的回答,我顺手拿起桌上的上年损益表看了一眼,然后又打开电脑调阅了该企业网络上首页信息的介绍,文字信息表述:该企业上年实现收入40亿,实现利润为1980万元,看完后,我又追问道:根据您企业网络介绍的信息来看,假如按照建筑行业税务机关核定利润率10—20%来测算,您企业上年实现利润最起码应该是在4000万以上,可是财务报表实现的利润率过低,为什么?

财务初始问题回答是:为了投标和漂亮的贷款报表,是虚拟的数据。后来在我的追问和数据异常的推理分析下,才悄悄的说:没想到数据会分析出我们的问题,我们其实有内外两套账。 这么多年税务机关也没有查出来。

所以,大数据社会信息共享时代,它的科学的理论和实践的思想以及强大的智能机器人分析的原理,都为纳税人提出了警示:侥幸心理将在下一步的延长追溯期被彻底击破。一个社会信息共性的大数据库,只要植入网络爬虫,政府各部门就会在最短的时间内获取到各项情报。

假设:  税务机关利用税务大数据平台和网络“爬虫”技术,对本市某一家汽车企业进行数据分析,按照该企业采取的一项营销措施,即:代办购车贷款的业务进行信息对接,将该企业代办购车贷款与银行贷款的数据与申报纳税的销售收入数据进行比对,如果发现贷款信息与该企业申报的收入出现严重不符,那么税务机关就会纵深检查,也就会发现企业采取真假两套账手法 进行逃逸税的行为。

例如:某税务机关在网络上看到一条房地产开发企业销售房屋的效益,信息中详细的介绍了该企业与香港某开发上联合开发楼盘......这条信息马上让税务机关产生了异议,根据税收征管信息该企业是100%内资控股,怎么会出来一个外商香港公司,经过追踪核查,发现该企业股东在一年前将30%股权出让给了香港某公司,对于这种出让股权的行为,按照税法规定是要按照公允价格申报缴纳20%个人所得税,但是,税务机关征管信息中并没有该股东申报纳税的记录,经过查验,该企业股东并没有申报纳税。

又如,某国税局开发网络爬虫分析软件,在最短的时间内轻松的破解了某企业资本运作税务检查过程中等等许多的难题。由此,大家看到,此次税务稽查“网络爬虫”的应用,将会为税务机关征收管理和监管创造了一个更加完善的体系。

 

税务稽查网络爬虫到底是怎么抓取纳税人涉税申报疑点?

税务机关在一次网络爬虫的操作的演示中:在电脑中打开一个软件,按照需要所取得信息,输入几个关键指标值,点击"确定",随着电脑屏幕上一个绿色小虫缓慢的爬过,几十个红色的预警信号出现在屏幕中,此时,税务人员只要点击爬虫抓,它就会抓取到所有的每一个预警信息,具有疑点的企业和疑点具体信息就即刻逐一显现出来。红色预警信号,显示企业在某个方面,存在较高的税收风险(即:纳税异常行为)。

 

看到 “网络爬虫”的功能,不由的有所冲动的套用和动了动一首歌中的几句词:

我掩饰不住的慌张 在迫不急待地张望

本以为这一路是好梦一场

而你的这张无边无际的网

轻易就把我 困在网中央

我越陷 越深 越迷惘 路越走 越远 越漫长

如何我才能躲过被你锁住的眼光

税务稽查种植的网络爬虫正在走向成熟和全面数据的覆盖。谁还说:俺不怕,俺上面有人?....... 

我掩饰不住的慌张 在迫不急待地张望

本以为这一路是好梦一场

而你的这张无边无际的网

轻易就把我 困在网中央

我越陷 越深 越迷惘 路越走 越远 越漫长

如何我才能躲过被你锁住的眼光

税务稽查种植的网络爬虫正在走向成熟和全面数据的覆盖。谁还说:俺不怕,俺上面有人?....... 

附案例1:百度地图被引入税务稽查

天津市国税局引入林业部门提供的第三方参考数据,按照草皮、各种类苗木的指导价格区间、单亩种植的承载能力、成熟周期,推算发票用量及累计最大开票额度,从而有效防范企业随意开具发票,销售非自产的免税农产品等情况。

天津市国税局利用百度地图标记企业种植使用地块位置,并将标记地块位置与乡镇土地规划部门和企业实际签订合同比对。由于标记地块位置具有唯一性,避免了虚假合同造成的地块重复。

附案例2:互联网+税务已经深入税务稽查

某市税务机关利用税务大信息平台,将银行房屋贷款按揭的数据与房地产开发公司申报纳税的销售(预售)收入数据进行比对,其涉税违法行为立刻现形,该房地产公司由于涉税数额巨大,公司相关责任人均被立案处理。

总结:

通过大信息平台,税务将与与网络运营商、认证中心、工商、财政、公安、海关、金融机构、外汇管理、国土规划和物流中心等有关部门实现信息互通、数据互联、资源共享,不断充实、持续扩展、实时更新纳税人信息库,便于稽查比对发现税收疑点!