本文是2022年我在群组里对于视频文件元数据会泄露拍摄者个人隐私的讨论。本文所涉及的分析时间区间年代久远,为2012-2016年间的事情,不会对相关朋友产生困扰。因此将分析内容放出,谨以此希望各位圈友在上传视频创作/浏览圈内站点时保护好自己的隐私安全。

以下为2022年讨论全文,部分内容或许已失效:

常见的metadata有这些,但是理论上,所有的数据都可以手动加进来,只要是个key/value对就可以。
2024-08-27T16:08:52.png

看了相当一部分视频元数据里记录的编码日期,似乎现在流传的大部分视频都不是厂商发布的原版视频了,都经历过重新编解码。一些系列里的视频编码日期非常接近,甚至就是同一天(已经想象到某些同好为了编码视频而几天连续工作熬死电脑的场景了hhhhh)
而茉莉的视频看起来有些没有经历过重新编码,观察编码日期可以大致推算出来视频拍摄时间。比如H40是16年五月底拍摄的,然后男主在十天后6月初就约了下一场拍了H42,我H41没找到(如果它没有重新编码的话)
以及M系列拍摄的很早,大约是2010-2015年底这个区间。大约一周拍一部(好猛啊)
有一些视频是同一天编码的,我看了一下是同一个贝贝,暂且认为是一次实践拍摄的多部视频,因此合并了。
这样算下来,男主实践频率约为6天一次(中位数为6)
2024-08-27T16:06:38.png

“间隔一天”的比例很高,有可能是两种情况:

  1. 一次实践视频较长,所以一些视频是分成两部,花两天剪辑完成
  2. 几次实践之后,拖延症犯了拖到了ddl(

本来我以为是男主因为工作日上班所以拖到了周末,但是统计了一下星期,发现并不是,男主空闲时间很均匀(甚至周二比周末还闲)
2024-08-27T16:13:20.png

以及年前年后(12月、1月、3月)男主约实践频繁,产量速度upup。
但是2月份因为过春节而很少约实践(从2010年春节到2015年底,六年只约了8场)
4、5、6月份是“淡季”,也许和学生春季学期较忙+假期少有关?
从7月份开始,学生分批放假,7、8月份是个高峰。
9月份学生返校+刚开学很多事情,稍有跌落,但有中秋节假期,所以不会过于谷底。
10月份的国庆假期是个实践的好时机,因此实践次数来了一拨上扬。
11月份没有假期,外加学生期中考试的,因此实践很少。
【瞎几把分析,如有雷同,倍感荣幸】
2024-08-27T16:06:56.png
茉莉男主也是个熬夜仙人
晚上10点后产出的粮占比达到50%,最晚熬到过凌晨4点(2012年4月18日)
有5次早上8点起床产粮
2024-08-27T16:07:25.png
男主从2011年开始大量产出M系列视频,2013年可能生活比较忙产量折半
2024-08-27T16:07:40.png
大概就这么多吧,以上数据基于M系列视频,未参考L与H系列数据(肝疼

我在pr和fcpx实际测试了一下,这里的时间(Encoded date)是开始编码的时间。
tagged date 是编码完成(渲染完成)的时间。
我数据表用的是encoded date🤣

这些数据倒不是很敏感,只有在大量数据下的情况才有意义,而因为茉莉系列的视频很多正好符合这个条件,所以整了个活。零碎的这些信息并不能辅助完成任何分析、人肉(
不过用来了解一个人的作息规律、生活安排还是可以的(

昨晚是睡不着觉所以整了一波活,也算是穿越十多年的表面考古了(
就是不知道这些没有经历过第三者编码的原视频还能有多少留存
一般重新编码的视频有两种情况:

  1. 原格式不是mp4而为了播放兼容性编码为mp4
  2. 编码者为了消除视频中的水印或有其他目的而修改原视频画面

在重复编码的过程中视频画质会降低,这是不可避免的。

如果是用fcpx剪辑分享的话要稍微留意,它相比pr会记录更多的metadata,包括视频名称、视频介绍(Movie_More)、演出者(Performer,这个最容易泄漏姓名,因为默认是本机用户名,在导出的时候可以选择删掉)。
同时fcpx 与 pr 处理encoded date 和 tagged date时有不同的逻辑(最少在我的电脑上是这样,MacOS,Apple Silicon, fcpx 10.6.3,pr 22.3.0,其他版本没有测试过)

  1. 视频容器(Container)里记录的encoded date,fcpx与pr均会记录为编码开始时间,tagged date会记录为编码结束时间
  2. 在容器内的stream里,fcpx会遵循惯例,encoded date和tagged date会与前述保持一致;而pr会将encoded date与tagged date统一记录为编码开始时间。

如果对这些内容非常在意,可以按照如下步骤使用ffmpeg工具便捷地清除相关metadata。
http://ffmpeg.org/download.html 这里可以选择自己使用的平台对应链接下载。
之后在终端(命令行、powershell),转到ffmpeg可执行文件所在文件夹后,使用命令
ffmpeg.exe -i 你想要处理的视频路径 -map_metadata -1 -c:v copy -c:a copy 输出视频名称路径
例如,(MacOS)我想要处理Downloads/test1.mp4 这个文件,输出文件到 Downloads/test1_removedmetadata.mp4
ffmpeg -i Downloads/test1.mp4 -mapmetadata -1 -c:v copy -c:a copy Downloads/test1_removemetadata.mp4
即可
这个步骤不会对视频重新编解码,不会影响视频画质,仅会清理掉metadata,并且速度很快。
下图左侧为处理过的视频metadata,右侧为原视频。
当然,一般情况下留存有metadata不是坏事,为视频多保留些信息总归是好的,万一以后用到了呢。

标签: 隐私

添加新评论