句易网敏感词检测

前言

以前在 github 我自己开源了一些项目。由于技术和精力,大部分项目都是 java 实现的。

这对于非 java 对于不会编程的用户来说,开发者非常不友好。

为了让更多的人使用这些简单的小工具,周末增加了几个开源项目 web 服务实现。

开源项目

中文复简体转换

简介:支持中文复简体的在线转换。

在线地址:https://houbb.github.io/opensource/opencc4j/

开源地址:https://github.com/houbb/opencc4j

用法简介

这里只选一个作为例子介绍,其它用法相似。

句易网敏感词检测

根据下拉框的选择,左边的内容会自动填充到右边。

交换交换左右两侧的内容。通常测试繁体=》简体,简体=》繁体更方便。

将右边的内容复制到粘贴板上。

敏感词

简介:基于 DFA 高性能算法实现 java 敏感词工具框架。不要发布涉及政治、广告、营销、翻墙、违反国家法律法规的内容。

在线地址:https://houbb.github.io/opensource/sensitive-word/

开源地址:https://github.com/houbb/sensitive-word

拼音

简介:高性能中文拼音工具。支持同音字。

在线地址:https://houbb.github.io/opensource/pinyin/

开源地址:https://github.com/houbb/pinyin

将一段文字转换为相应的拼音非常方便,如默认如下:

yǐ qián zài github shàng zì jǐ kāi yuán le yī xiē xiàng mù 。 ài yú jì shù yǔ jīng lì , dà bù fèn xiàng mù dōu shì java shí xiàn de 。 zhè duì yú fēi java kāi fā zhě ér yán hěn bù yǒu hǎo , duì yú bú huì biān chéng de yòng hù gèng jiā bù yǒu hǎo 。 wèi le ràng gèng duō de rén kě yǐ shǐ yòng dào zhè xiē jiǎn dān de xiǎo gōng jù , zhōu mò chōu shí jiān jiāng jǐ gè kāi yuán xiàng mù tiān jiā le web fú wù shí xiàn 。

分词

简介:基于结巴分词库,更加灵活、优雅、易用、高性能 java 分词实现。

在线地址:https://houbb.github.io/opensource/segment/

开源地址:https://github.com/houbb/segment

分词,可以说是 NLP 的基石。

前言内容分词效果如下:

[以前[0,2), 在[2,3),  [3,4), github[4,10),  [10,11), [11,13), 己[13,14), 开源[14,16), 了[16,17), 一些[17,19), 项目[19,21), 。[21,22), [22,24), 技术[24,26), 与[26,27), 能量[27,29), ,[29,30), 大部分[30,33), 项目[33,35), 都[35,36), 是[36,37),  [37,38), java[38,42),  [42,43), [43,45), 的[45,46), 。[46,47), [47,48), [48,49), 这[49,50), 对[50,52), 非[52,53),  [53,54), java[54,58),  [58,59), 开发者[59,62), [62,64), 很[64,65), 不[65,66), 友好[66,68), ,[68,69), 对[69,71), 不会, 编程[73,75), 的[75,76), 用户[76,78), 更多[78,80), 不[80,81), 友好[81,83), 。[83,84), [84,85), [85,86), 为[86,88), 让[88,89), 更多[89,91), 的[91,92), 人[92,93), [93,95), 使用[95,97), 到[97,98), [98,100), 简单[100,102), 的[102,103), 小工[103,105), 具[105,106), ,[106,107), 周末[107,109), 抽时间[109,112), 将[112,113), 几个[113,115), 开源[115,117), 项目[117,119), 添加[119,121), 了[121,122),  [122,123), web[123,126),  [126,127), 服务[127,129), [129,131), 。[131,132)]

汉字相似度

简介:汉字相似度计算工具。中文近字算法

在线地址:https://houbb.github.io/opensource/nlp-hanzi-similar/

开源地址:https://github.com/houbb/nlp-hanzi-similar

markdown 目录

简介:为 markdown 文件生成 toc 目录

在线地址:https://houbb.github.io/opensource/markdown-toc/

开源地址:https://github.com/houbb/markdown-toc

个人博客通常使用 markdown 注重写作。markdown-toc 这样的文本可以生成对应的 toc。

比如这篇文章直接放在里面, github 支持跳转。

* [前言](#前言) * [开源项目](#开源项目)   * [中文复简体转换](#中文复简体转换)     * [用法简介](#用法简介)   * [敏感词](#敏感词)   * [拼音](#拼音)   * [分词](#分词)   * [汉字相似度](#汉字相似度)   * [markdown 目录](#markdown-目录)
句易网敏感词检测

小结

这样的小工具很容易实现。

但对用户来说意义重大。

最近在学习 AI 平时不搞相关的事情。 python,没有很多开源项目 web 体验版看起来很难。

不同的语言产生了不可逾越的鸿沟。愿你我借助 WEB 跨越过去的力量

原文地址

在线开源项目[1]

References

[1] 网上开源项目: https://houbb.github.io/2022/11/06/opensource-tool-online

今天的文章就分享到这里,如果你也网赚副业项目感兴趣,可以添加 维信:beng6655  备注:副业

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 526323532@qq.com 举报,一经查实,本站将立刻删除。
如若转载,请注明出处:https://www.haoxue2.com/10915.html