一个前端标签问题

Question

asked Jan 25, 2021 in Technique[技术] by 深蓝 (71.8m points)

https://gongshang.mingluji.com/beijing/name/朗乐迅洁（北京）科技有限责任公司
https://gongshang.mingluji.com/beijing/name/硕链科技有限公司

感觉每个注册资金的标签都不一样啊，这种怎么提取"资金" 标签呢？

与恶龙缠斗过久,自身亦成为恶龙；凝视深渊过久,深渊将回以凝视…

1 Answer

深蓝 · Answer 1 · 2021-01-25T05:34:53+0000

你是要只提取资金数值吗？比如“5000”还是说提取整个“5000万元人民币”

如果是后者，直接提取整个span标签的文本内容就行了，然后去掉空格。例如用jquery来提取(至于怎么准确获取到这个span就不说了，方式很多，看具体需求。我就直接写span了)
const value = $('span').text().trim();

如果是前者，在上面的基础上，通过正则去匹配，把不是数值的部分过滤掉就行了

----更新

不好意思，没有注意这个span标签里的内容，还有题主说的很多脏数据标签
如果脏数据标签是有规律的就这几种，那可以这样，已经测试过

先通过正则把这些标签都匹配出来，然后过滤掉
const reg = /<em[^>]*>(.| )*</em>|<b[^>]*>(.| )*</b>|<i[^>]*>(.| )*</i>|<div[^>]*>(.| )*</div>/gi;

const valWidthDom = $('span').html();

const realValue = valWidthDom.replace(reg, '');

测试结果如下