第五章：内容安全基础-JZTXT

##教材学习总结

思维导图：总揽全局

各个小节思维导图及简介

第一节：信息内容安全概述

*数据内容成为互联网的中心关注点

*正面影响：大数据正在逐步演变为生产力

*负面影响：不良信息的大量传播，不正当行为泛滥

*产生原因：

（1）在互联网爆炸性发展的同时，相关方面的规范和管理措施未能同步发展

（2）互联网在为人们提供遍历获取与发布信息的同时，制造了前所未有的思想碰撞场所

第二节：内容安全威胁

*内容威胁的两个方面：

（1）内容安全所面临的威胁有泄露、欺骗、破坏和篡改的风险

*互联网中有大量的公开信息

*互联网的开放性和自主性导致信息有各个组织自发生成并共享到互联网中，带来欺骗

*信息会被非法传播

（2）恶意用户产生的恶意内容会在网上传播

*个人由信息的接收者变为信息的创造者与传播者

*水军用户的恶意行为

*内容中心网络缓存容易受到不同类型的攻击，会污染破坏缓存系统

第三节：网络信息内容获取

1. 网络信息内容获取技术

*早期：网络交互过程编程重构机制

*发展：基于浏览器模拟技术实现网络媒体信息获取

*理想：URL集合——信息“种子”集合

2. 信息内容获取的典型工具

网络爬虫

*分类：服务于搜索引擎的网络爬虫、服务于进行针对性信息收集的应用网络爬虫

*用途：舆情分析，智能手持设备及相关应用的发展

3. 信息内容特征抽取与选择

3.1文本内容的特征抽取与选择

*方式：对文本内容进行：过滤和分类、类聚处理、自动摘要、用户兴趣模式发现、知识发现

3.2音频信息内容的特征抽取与选择

*方式：基于帧的特征，基于片段的特征

*基于帧的特征：

（1）MFCC

（2）频域能量

（3）子带能量比

（4）过零率

（5）基音频率

*基于片段的音频特征

（1）静音帧率

（2）高过零帧率

（3）低能量帧率

（4）谱通量

（5）和谐度

3.3图像信息的特征抽取与选择

（1）图像颜色特征提取：颜色直方图、颜色聚合矢量、颜色矩

（2）图像纹理特征提取：灰度共生矩阵、Gabor小波特征、Tamura等根据人类视觉感知系统的特点

（3）其他图像特征：边缘特征、轮廓特征

第四节：信息内容分析与处理

1. 信息内容分类

（1）线性分类器：完全依赖于线性判别函数

（2）最近邻分类法：分类结果取决于测试样本与各类训练样本点之间的距离

（3）支持向量机：能够最小化经验误差和最大化集合边缘区

2.信息内容过滤

*常见的应用

(1) internet搜索结果的过滤

(2) 用户电子邮件过滤

(3) 服务器/新闻组过滤

(4) 浏览器过滤

(5) 专为未成年人过滤

(6) 为客户过滤

第五节：网络舆情内容监测与预警

1. 网络舆情系统的背景与应用范围

*网络舆情监测技术的发展趋势：

（1）针对信息源的深入信息采集

（2）异构信息的融合分析

（3）非结构信息的结构化表达

2. 网络舆情系统的功能分解

（1）高仿真网络信息深度提取技术

*重点研究智能化、高效率的远程网络互动式动态信息的全面提取

（2）基于语义的海量媒体内容特征快速提取与分类技术

*重点研究针对网络文本媒体

（3）非结构信息自组合聚合表达技术

*重点研究针对海量非结构化信息库

3. 互联网舆情内容分析

*深度挖掘技术

*在提取信息发布作者、发布时间、URL、主题等关键信息的基础上，进而归一化存储来自异构站点的发布内容

第六节：内容中心网络及安全

1. 内容中心网络架构

（1）内容信息对象

*包括但不仅限于：网页、文档、电影、照片、歌曲以及流媒体和互动媒体

（2）命名

*具有全局性和唯一性

（3）路由

*北荣信息分发依赖于内容发布与订阅的异步机制

（4）缓存

*原则：统一的、民主的

（5）应用程序编程接口

发布和获取两个操作都使用内容信息对象的名称作为组织参数

2. 面向内容中心网络的攻击分类

（1）命名相关攻击

允许攻击者审查和过滤内容，获取有关内容流行性和用户兴趣的私人信息

（2）路由相关攻击

分为：分布式拒绝任务、欺骗攻击

（3）缓存相关攻击

内容中心网络中的缓存相关攻击可能引发拒绝服务、隐私泄露、缓存污染

（4）其他攻击

其他攻击包括攻击者试图获取受限访问内容，攻击者试图破坏签名者的密钥并充当和法的发布者，攻击者尝试修改、删除或重播内容

##教材中的问题及解决过程

问：在内容安全基础领域，有哪些挑战是需要克服的？

答：

1. 大量异构数据处理：内容安全涉及到大量的文本、图片、音视频等多种数据格式，处理这些异构数据需要高效的技术手段。


实时性要求：对于内容安全的检测和处理，往往需要快速响应。实时性是内容安全领域需要克服的一个重要挑战。


智能恶意攻击：随着人工智能技术的发展，恶意攻击者可以制作出更加难以察觉的恶意内容。应对这些智能恶意攻击是内容安全领域的另一大挑战。


多样化的恶意行为识别：内容安全领域需要对各种恶意行为进行识别，包括诈骗、网络暴力、谣言传播等。这需要开发出多样化的识别算法和技术。


隐私保护：在处理内容安全问题时，需要平衡隐私保护和公共利益之间的关系。如何在保障用户隐私的同时，有效地识别和处理恶意内容，是一个亟待解决的挑战。


法律法规约束：内容安全领域需要遵循不同国家和地区的法律法规，这为内容安全技术的发展带来了一定的限制和挑战。


跨平台和跨领域协作：内容安全问题涉及到多个平台和领域，如社交网络、电商平台、在线教育等。实现跨平台和跨领域的协作，共同应对内容安全挑战是必要的。


不断更新的恶意手段：恶意攻击者会不断更新攻击手段，内容安全领域需要不断学习和适应这些新手段，以保持防护能力的有效性。