Skip to Content

媒体类型

2019-02-27·Multimedia

数字音频

  • 声音文件
    • CD: 业界标准
    • WAV: 储存
    • MID, RMI: 合成音乐
    • MP3: 着重压缩
    • ra, rm, rmvb, WMA: 网络传输
  • 电脑音乐创作
    • 编曲 -> 合成 -> 后期制作
    • CakeWalk, Vegas Audio, CoolEdit, Auto Score
    • 语音合成引擎 VOCALOID 2
    • 打谱软件 Overture
  • 媒体关联
    • 文本-语音转换
    • 声音可视化
  • 声音信号
    • 听觉 20~20000 Hz
    • 发出 80~3400 Hz
    • 话音信号 300~3000 Hz
    • 听阈:声音弱到刚好能听到(频率相关)
    • 痛阈(频率相关)
基音域泛音域伴随噪声域
钢琴27.5Hz4188Hz7040Hz
管风琴18.4Hz7902Hz14080Hz
低音大管25Hz220Hz7902Hz
竖琴61.7Hz1975Hz - 7902Hz12544Hz
大号55Hz440Hz - 3951Hz7040Hz
长号55Hz523Hz5274Hz
小号147Hz1175Hz10548Hz
低音提琴29Hz440Hz - 4500Hz11175Hz
大提琴61.7Hz1588Hz - 8372Hz16774Hz
中提琴140Hz2350Hz - 9500Hz18799Hz
小提琴180Hz4100Hz - 9500Hz18800Hz
男低音82.5Hz392Hz8350Hz
男中音120Hz460Hz8370Hz
男高音173Hz650Hz8370Hz
女低音190Hz1318Hz8200Hz
次女高音240Hz1396Hz8200Hz
女高音260Hz1590Hz8820Hz
大管66Hz698Hz8200Hz
单簧管134Hz1420Hz - 8920Hz12544Hz
双簧管240Hz1540Hz12544Hz
竹笛150Hz2100Hz19700Hz
短笛510Hz4250Hz12544Hz
大鼓60Hz166Hz - 1800Hz6100Hz
木琴166Hz2100Hz13000Hz
三角铁2000Hz2300Hz16000Hz
  • 声音类别
    • 任意无规则:1/f0 波动
    • 严密变化规律:1/f2 波动
    • 不规则但给有特别性质的:1/f1 波动
  • 固有频率
    • 眼球:60Hz
    • 露骨:200Hz
    • 整体水平:3-6Hz
    • 整体竖置:48Hz
  • 频带
    • 全频带:下限 3060Hz,上限 15KHz20KHz
    • 杜比数码环绕声系统(Dolby Stereo digital, AC-3):互相独立 6 声道(5.1 声道),全频带的左,右,中,左环绕,右环绕和 120HZ 以下的低音声道
    • A3D Surround 技术:创造环绕听者的 5 组音频流声场,使用两个音箱播放
    • SRS:使用两个音箱仿 3D 环绕声
  • 数字音频文件大小:Byte = 采样频率 * 采样位数 / 8 * 声道数 * 时间
    • 奈奎斯特采样
    • speech sampling 8kHz
    • CD sampling 44.1kHz
    • HDCD sampling 48/96kHz
  • MIDI 电子乐器数字接口:音乐合成器、乐器、计算机交互音乐信息的标准协议
    • 命令集合
    • 串行接口 31.23k 波特
    • 单个物理通道可以分成 16 个逻辑通道,每个逻辑通道可以指定一种乐器
    • 合成器:利用数字信号处理器或者其他芯片产生音乐或声音的装置
    • 产生方法
      • FM 合成法:频率调制合成
      • wavetable:乐音样本合成法

数字图像

  • 视觉知识

    • 可见光:380nm - 780nm

    • 彩色空间

      • YUV:RGB 加权,考虑到人的视觉系统和 CRT 非线性特性(NTSC 彩色电视制式)

        • Y:明亮度,只有 YY 则是黑白

          Y=0.299R+0.587G+0.114BY=0.299R+0.587G+0.114B

        • UV:色度

          U=0.492(BY)U=0.492(B-Y)

          V=0.887(RY)V=0.887(R-Y)

      • YIQ:(PAL 和 SECAM 彩色电视制式)

        • IQ: UV 进行旋转镜像变换
      • YCrCb:(计算机显示器)

    • 六基色彩电

    • 伽马矫正:非线性 y=xγy=x^\gamma

      • 摄像机传感器(γ0.45\gamma\approx 0.45
      • 编码图像文件
      • 解码图像文件
      • 图像帧缓存查找表
      • CRT
    • 人眼

      • 300ppi
      • 临界闪烁频率 46 Hz
  • 显示器

    • CRT 带宽 = 最大分辨率 * 刷新率 * 1.3(1.5)
    • LED, CRT, PDP, LCD
    • 手机彩屏:STN, TFT, OLED
    • Retina Display: 将一个像素点拆为四个
  • 打印机

    • DPI
    • PPM
  • 扫描仪

    • 光学分辨率,最大分辨率
    • 色彩深度和灰度
    • CCD(电荷耦合元件)
    • CIS(接触式图像传感器)
  • 图像文件

    • BMP:windows,无压缩
    • TIFF:扫描仪
    • GIF, JPEG, PNG:网络传播

数字视频

  • 雷霄骅的博客是很好的学习资料
  • 视频播放过程:解协议 -> (封装格式数据) -> 解封装 -> (压缩数据) -> 解码 ->(原始数据) -> 视音频同步
  • 流媒体协议
推出机构传输层协议客户端使用领域
RTSP+RTPIETFTCP+UDPVLC, WMPIPTV
RTMPAdobe Inc.TCPFlash直播
RTMFPAdobe Inc.UDPFlash直播
MMSMicrosoft Inc.TCP/UDPWMP直播/点播
HTTPWWW+IETFTCPFlash点播
  • 直播服务普遍采用了 RTMP 作为流媒体协议,FLV 作为封装格式,H.264 作为视频编码格式,AAC 作为音频编码格式
  • 点播服务普遍采用了 HTTP 作为流媒体协议,H.264 作为视频编码格式,AAC 作为音频编码格式
  • 封装格式
推出机构流媒体视频编码音频编码使用领域
AVIMicrosoft Inc.不支持几乎所有格式几乎所有格式BT 下载
MP4MPEG支持MPEG-2,MPEG-4,H.264,H.263AAC, MPEG-1 Layers 1/2/3, AC-3互联网视频网站
TSMPEG支持MPEG-1, MPEG-2, MPEG-4, H.264MPEG-1 Layers 1/2/3, ACCIPTV, 数字电视
FLVAdobe Inc支持Sorenson, VP6, H.264MP3, ADPCM, Linear PCM, AAC互联网视频网站
MKVCoreCodec Inc.支持几乎所有格式几乎所有格式互联网视频网站
RMVBReal Networks Inc.支持RealVideo 8,9,10AAC, Cook Codec, RealAudio LosslessBT 下载
MOVApple
  • 常见格式的分辨率
    • 线数:水平分解能力(水平像素一半)
    • p: 逐行扫描
    • i: 各行扫描
格式水平(像素)垂直建议码率
sub-QCIF12898
QCIF176144
CIF352288
4CIF704576
16CIF14081152
1080192016:98500kbps
720128016:93500kbps
48070416:9/4:31800kbps
3206404:3
HDTV1000 线
SDTV500-600 线
DTV200-300 线
  • 文件大小 = 时间 x 码率 /8
  • 数字视频
    • 视频:实时摄影
      • 封装格式:avi,mov,qt,mpeg,mpg,dat,rm,rmvb
    • 动画:人工或计算机生成
      • gif
      • flic 文件:.fli/.flc
      • flash 文件
  • 视频接口
    • 模拟
      • 复合视频
      • 色差输入
      • S-Video
      • D-sub
    • 数字
      • DVI
      • HDMI
      • DP
  • 数据视频获取
    • DV(Digital Video Format)
      • 码率 3.6MB/s, 720x576,音频 48KHz
      • 变焦:光学变焦,数码变焦
      • 色温:单位开尔文
        • 蜡烛 <1900K
        • 白昼 5000K
        • 普通日光灯 4500K~6000K
        • 阴天 >6000K
        • 蓝天 >10000K
    • CCD(Charged Coupled Device)
    • 视频采集卡:通过接受视频输入端的模拟视频信号,采样量化后压缩编码
      • 视频压缩卡:带有硬件压缩功能
      • 非线性编辑卡:实时编辑
  • 电视制式:带宽 270Mbits/s
    • PAL
      • 扫描线:625 行/帧
      • 刷新率:25 帧/秒
      • YUV
    • NSTC
      • 扫描线:525 行/帧
      • 刷新率:30 帧/秒
      • YIQ
    • SECAM