使用Python获取照片Exif信息

什么是Exif?

Exif(Exchangeable image file format)是专门为数码相机的照片设定的,可以记录数码照片的属性信息和拍摄数据。Exif信息是镶嵌在 JPEG/TIFF 图像文件格式内的一组拍摄参数,它就好像是傻瓜相机的日期打印功能一样,只不过 Exif信息所记录的资讯更为详尽和完备。Exif 所记录的元数据信息非常丰富,主要包含了以下几类信息:

  • 拍摄日期
  • 拍摄器材(机身、镜头、闪光灯等)
  • 拍摄参数(快门速度、光圈F值、ISO速度、焦距、测光模式等)
  • 图像处理参数(锐化、对比度、饱和度、白平衡等)
  • 图像描述及版权信息
  • GPS定位数据
  • 缩略图

示例:

项目信息(举例)
制造厂商Canon
相机型号Canon EOS-1Ds Mark III
图象方向正常(upper-left)
图象分辨率X300
图象分辨率Y300
分辨率单位dpi
SoftwareAdobe Photoshop CS Macintosh
最后异动时间2005:10:06 12:53:19
YCbCrPositioning2
曝光时间0.00800 (1/125) sec
光圈值F22
拍摄模式光圈优先
ISO感光值100
Exif信息版本30,32,32,31
图象拍摄时间2005:09:25 15:00:18
图象存入时间2005:09:25 15:00:18
曝光补偿(EV+-)0
测光模式点测光(Spot)
闪光灯关闭
镜头实体焦长12 mm
Flashpix版本30,31,30,30
图象色域空间sRGB
图象尺寸X5616 pixel
图象尺寸Y3744 pixel

0xFFE0 — 0xFFD9之间的标识符称为“应用标记”,一般称为APPn,JPEG的编码和解码并不会使用这些段,Exif 正是利用这些信息串记录拍摄信息如快门速度、光圈值等。Exif信息是可以被任意编辑的,因此只有参考的功能。

Exif包含哪些信息?

Exif/TIFF使用的标签数

下面显示了 Exif/TIFF 使用的标签数,如果这个标签组件数目的上限。CompoNo 一栏就代表这一数值。如果这个数值没有,则说明这儿没有上限值。

IFD0 (主图像)使用的标签
标签号标签名格式组件数描述
0x010eImageDescriptionascii string用来描述图像. 双字节的字符码不能使用, 如 中文/韩文/日文.
0x010fMakeascii string表示数字相机的制造商. 在 Exif 标准中, 这个标签是可选的, 但是在DCF中它是必需的.
0x0110Modelascii string表示数字相机的模块代码(型号). 在 Exif 标准中, 这个标签是可选的, 但在DCF中它也是必需的.
0x0112Orientationunsigned short1
Value0th Row0th Column
1topleft side
2topright side
3bottomright side
4bottomleft side
5left sidetop
6right sidetop
7right sidebottom
8left sidebottom

当拍照时, 相机相对于场景的方向. 在右边表示的是’0th row’ 以及 ‘0th column’ 在视觉位置上的关系.

0x011aXResolutionunsigned rational1图像的 显示/打印 分辨率. 缺省值是 1/72英寸, 但是它没有意义因为个人PC在 显示/打印 图像的时候不使用这个值.
0x011bYResolutionunsigned rational1
0x0128ResolutionUnitunsigned short1XResolution(0x011a)/YResolution(0x011b)的单位. ‘1’ 表示没有单位, ‘2’ 意味着英寸, ‘3’ 表示厘米. 缺省值是 ‘2’(英寸).
0x0131Softwareascii string显示固件的版本号(数字相机的内部控制软件).(固件Firmware版本或编辑软件)
0x0132DateTimeascii string20图像最后一次被修改时的日期/时间. 日期的格式是 “YYYY:MM:DD HH:MM:SS”+0x00, 一共 20个字节. 如果没有设置时钟或者数字相机没有时钟, 则这个域是用空格来填充. 通常, 它和DateTimeOriginal(0x9003)具有相同的值
0x013eWhitePointunsigned rational2定义图像白点(white point/白点:在彩色分色、照相或摄影时作为色彩平衡测量用途的参考点) 的色度(chromaticity). 如果图像是用CIE标准照度 D65(著名的是 ‘光线/daylight’的国际标准), 这个值是 ‘3127/10000,3290/10000’.
0x013fPrimaryChromaticitiesunsigned rational6定义图像的原始色度. 如果图像使用 CCIR 推荐 709原始色度, 则这个值是 ‘640/1000,330/1000,300/1000,600/1000,150/1000,0/1000’.
0x0211YCbCrCoefficientsunsigned rational3当图像的格式是 YCbCr(JPEG的格式), 这个值表示转换成 RGB格式的一个常量. 通常, 这个值是’0.299/0.587/0.114′.
0x0213YCbCrPositioningunsigned short1当图像的格式是 YCbCr 并且使用 ‘子采样/Subsampling'(色度数据的剪切值, 所有的数字相机都使用), 定义了subsampling 像素阵列的色度采样点. ‘1’表示像素阵列的中心, ‘2’ 表示基准点.
0x0214ReferenceBlackWhiteunsigned rational6表示黑点(black point)/白点 的参考值. 在YCbCr 格式中,前两个值是 Y的黑点/白点, 下两个值是 Cb, 最后两个值是 Cr. 而在 RGB 格式中, 前两个表示R的黑点/白点, 下两个是 G, 最后两个是 B.
0x8298Copyrightascii string表示版权信息
0x8769ExifOffsetunsigned long1Exif 子IFD的偏移量

 

Exif 子IFD使用的标签
标签号标签名格式组件数描述
0x829aExposureTimeunsigned rational1曝光时间 (快门速度的倒数). 单位是秒.
0x829dFNumberunsigned rational1拍照时的光圈F-number(F-stop).
0x8822ExposureProgramunsigned short1拍照时相机使用的曝光程序. ‘1’ 表示手动曝光, ‘2’ 表示正常程序曝光, ‘3’ 表示光圈优先曝光, ‘4’ 表示快门优先曝光, ‘5’ 表示创意程序(慢速程序), ‘6’ 表示动作程序(高速程序), ‘7’表示 肖像模式, ‘8’ 表示风景模式.
0x8827ISOSpeedRatingsunsigned short2CCD 的感光度, 等效于 Ag-Hr 胶片的速率.
0x9000ExifVersionundefined4Exif 的版本号. 用4个ASCII字符来存储. 如果图片是基于Exif V2.1的, 这个值是 “0210”. 因为它不是一个用NULL(0x00)来终结的字符串,所以这里的类型是 ‘undefined’.
0x9003DateTimeOriginalascii string20照片在被拍下来的日期/时间. 使用用户的软件是不能被修改这个值的. 日期的格式是 “YYYY:MM:DD HH:MM:SS”+0x00, 一共占用20个字节. 如果数字相机没有设置时钟或者 数字相机没有时钟, 这个域使用空格来填充. 在Exif标准中, 这个标签是可选的, 但是在 DCF中是必需的.
0x9004DateTimeDigitizedascii string20照片被数字化时的日期/时间. 通常, 它与DateTimeOriginal(0x9003)具有相同的值. 数据格式是 “YYYY:MM:DD HH:MM:SS”+0x00, 一共占用20个字节. 如果数字相机没有设置时钟或者 数字相机没有时钟, 这个域使用空格来填充. 在Exif标准中, 这个标签是可选的, 但是在 DCF中是必需的.
0x9101ComponentsConfigurationundefined表示的是像素数据的顺序. 大多数情况下RGB格式使用 ‘0x04,0x05,0x06,0x00’ 而YCbCr 格式使用 ‘0x01,0x02,0x03,0x00’. 0x00:并不存在, 其他的对应关系为 0x01:Y, 0x02:Cb, 0x03:Cr, 0x04:Red, 0x05:Green, 0x06:Bllue.
0x9102CompressedBitsPerPixelunsigned rational1JPEG (粗略的估计)的平均压缩率.
0x9201ShutterSpeedValuesigned rational1用APEX表示出的快门速度. 为了转换成原始的 ‘Shutter Speed’; 则先要计算2的ShutterSpeedValue次幂, 然后求倒数. 例如, 如果 ShutterSpeedValue 是 ‘4’, 快门速度则是1/(24)=1/16秒.
0x9202ApertureValueunsigned rational1拍照时镜头的光圈. 单位是 APEX. 为了转换成普通的 F-number(F-stop), 则要先计算出根号2 2 (=1.4142)的ApertureValue次幂. 例如, 如果ApertureValue 是 ‘5’, F-number 就等于1.41425 = F5.6.
0x9203BrightnessValuesigned rational1被拍摄对象的明度, 单位是 APEX. 为了从BrigtnessValue(Bv)计算出曝光量(Ev), 你必须加上 SensitivityValue(Sv).
Ev=Bv+Sv   Sv=log2(ISOSpeedRating/3.125)
ISO100:Sv=5, ISO200:Sv=6, ISO400:Sv=7, ISO125:Sv=5.32.
0x9204ExposureBiasValuesigned rational1照片拍摄时的曝光补偿. 单位是APEX(EV).
0x9205MaxApertureValueunsigned rational1镜头的最大光圈值. 你可以通过计算根号2的MaxApertureValue次幂来转换成普通的光圈 F-number (跟ApertureValue:0x9202的处理过程一样).
0x9206SubjectDistancesigned rational1到焦点的距离, 单位是米.
0x9207MeteringModeunsigned short1曝光的测光方法. ‘0’ 表示未知, ‘1’ 为平均测光, ‘2’ 为中央重点测光, ‘3’ 是点测光, ‘4’ 是多点测光, ‘5’ 是多区域测光, ‘6’ 部分测光, ‘255’ 则是其他.
0x9208LightSourceunsigned short1光源, 实际上是表示白平衡设置. ‘0’ 意味着未知, ‘1’是日光, ‘2’是荧光灯, ‘3’ 白炽灯(钨丝), ’10’ 闪光灯, ’17’ 标准光A, ’18’ 标准光B, ’19’ 标准光C, ’20’ D55, ’21’ D65, ’22’ D75, ‘255’ 为其他.
0x9209Flashunsigned short1‘0’ 表示闪光灯没有闪光, ‘1’ 表示闪光灯闪光, ‘5’ 表示闪光但没有检测反射光, ‘7’ 表示闪光且检测了反射光.
0x920aFocalLengthunsigned rational1拍摄照片时的镜头的焦距长度. 单位是毫米.
0x927cMakerNoteundefined制造商的内部数据. 一些制造商如 Olympus/Nikon/Sanyo 等在这个区域中使用IFD 格式的数据.
0x9286UserCommentundefined存储用户的注释. 这个标签允许使用两字节的德字符或者 unicode. 前8 个字节描述的是字符集. ‘JIS’ 是日文 (著名的有 Kanji).
‘0x41,0x53,0x43,0x49,0x49,0x00,0x00,0x00’:ASCII
‘0x4a,0x49,0x53,0x00,0x00,0x00,0x00,0x00’:JIS
‘0x55,0x4e,0x49,0x43,0x4f,0x44,0x45,0x00’:Unicode
‘0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00’:Undefined
0x9290SubsecTimeascii string一些数字相机每秒能拍摄 2~30 张照片, 但是DateTime/DateTimeOriginal/DateTimeDigitized 标签只能记录到秒单位的时间. SubsecTime 标签就是用来记录秒后面的数据(微秒).
例如, DateTimeOriginal = “1996:09:01 09:15:30”, SubSecTimeOriginal = “130”, 合并起来的原始的拍摄 时间就是 “1996:09:01 09:15:30.130”
0x9291SubsecTimeOriginalascii string
0x9292SubsecTimeDigitizedascii string
0xa000FlashPixVersionundefined4存储FlashPix 的版本信息. 如果图像数据是基于 FlashPix formar Ver.1.0, 则这个值为 “0100”. 因为它不是一个用NULL(0x00)来终结的字符串,所以这里的类型是 ‘undefined’.
0xa001ColorSpaceunsigned short1定义色彩空间. DCF 图像必须使用 sRGB 色彩空间因此这个值总是 ‘1’. 如果这个照片使用了 其他的色彩空间, 这个值是 ‘65535’:未校准(Uncalibrated).
0xa002ExifImageWidthunsigned short/long1主图像的尺寸大小.
0xa003ExifImageHeightunsigned short/long1
0xa004RelatedSoundFileascii string如果数字相机能够纪录图像的音频数据, 则表示音频数据的名字.
0xa005ExifInteroperabilityOffsetunsigned long1表示这是一个扩展”ExifR98″, 细节未知. 这个值经常是IFD格式的数据. 当前这儿有两个 目录项, 第一个是 Tag0x0001, 值是”R98″, 下一个是 Tag0x0002, 它的值为 “0100”.
0xa20eFocalPlaneXResolutionunsigned rational1表示CCD的像素密度. 如果你的相机是百万像素的并且是用低分辨率(如VGA模式) 来拍摄照片, 这个值可以通过照片的分辨率来重新采样. 在这种情况下, FocalPlaneResolution 就不是CCD的实际的分辨率.
0xa20fFocalPlaneYResolutionunsigned rational1
0xa210FocalPlaneResolutionUnitunsigned short1FocalPlaneXResoluton/FocalPlaneYResolution的单位. ‘1’ 表示没有单位, ‘2’是英寸inch, ‘3’ 表示厘米.

注意:一些Fujifilm的数码相机(如.FX2700,FX2900,Finepix4700Z/40i 等) 使用的值是 ‘3’ 所以它的单位一定是 ‘厘米’ , 但是它们的分辨率单位就变成’8.3mm?'(1/3in.?). 这是Fuji 的 BUG? 从Finepix4900Z 开始这个值就使用 ‘2’ 了但仍然跟实际的值不吻合.

0xa215ExposureIndexunsigned rational1跟ISOSpeedRatings(0x8827)一样但是数据类型是 unsigned rational. 只有Kodak的数字相机使用 这个标签来替代 ISOSpeedRating, 我不知道这是为什么(历史原因?).
0xa217SensingMethodunsigned short1表示图像传感器单元的类型. ‘2’ 意味着这是一个芯片颜色区域传感器, 几乎所有的数字相机都 使用这个类型.
0xa300FileSourceundefined1显示图像来源. 值 ‘0x03’ 表示图像源是数字定格相机.
0xa301SceneTypeundefined1表示拍摄场景的类型. 值 ‘0x01’ 表示图像是通过相机直接拍摄出来的.
0xa302CFAPatternundefined表示色彩过滤阵列(CFA) 几何模式.

长度类型意义
2shortHorizontal repeat pixel unit = n
2shortVertical repeat pixel unit = m
1byteCFA value[0,0]
:::
1byteCFA value[n-1,0]
1byteCFA value[0,1]
:::
1byteCFA value[n-1,m-1]

色彩过滤和CFA值之间的关系.

Filter ColorRedGreenBlueCyanMagentaYellowWhite
CFA value0123456

 

RG
GB

例如, 普通的 RGB 过滤器使用左表的副本, 这个值是 ‘0x0002,0x0002,0x00,0x01,0x01,0x02’.

 

Interoperability IFD使用的标签
标签号标签名格式组件号描述
0x0001InteroperabilityIndexAscii string4如果这个IFD 是主图像的 IFD 并且文件内容采用的是 ExifR98 v1.0, 那这个值就是 “R98”. 如果是所略图的, 这个值则是 “THM”.
0x0002InteroperabilityVersionUndefined4纪录interoperability的版本. “0100” 表示版本1.00.
0x1000RelatedImageFileFormatAscii stringany纪录图像文件的文件格式. 这个值是 ascii 字符串(如. “Exif JPEG Ver. 2.1”).
0x1001RelatedImageWidthShort or Long1纪录图像的大小尺寸.
0x1001RelatedImageLengthShort or Long1

 

IFD1 (缩略图)使用的标签
标签号标签名格式组件数描述
0x0100ImageWidthunsigned short/long1表示缩略图的大小.
0x0101ImageLengthunsigned short/long1
0x0102BitsPerSampleunsigned short3当图像格式没有经过压缩, 这个值表示每像素的比特位的数目. 通常这个值是 ‘8,8,8’
0x0103Compressionunsigned short1代表压缩的方式. ‘1’ 表示非压缩, ‘6’ 表示JPEG 压缩格式.
0x0106PhotometricInterpretationunsigned short1表示图像数据组件的色彩空间. ‘1’ 意味着单色, ‘2’表示 RGB, ‘6’ 表示 YCbCr.
0x0111StripOffsetsunsigned short/long如果图像格式没有经过压缩, 这个值表示的是到图像数据的偏移量. 在图像数据被分割的 情况下它有多个值.
0x0115SamplesPerPixelunsigned short1如果图像格式没有经过压缩, 这个值表示每个像素中存储的组件数目. 在彩色图像中, 此值为 ‘3’.
0x0116RowsPerStripunsigned short/long1如果图像格式没有经过压缩 并且 图像被分割存储, 这个值表示每条数据带存储了多少行数据 . 如果图像没有被分割, 它与ImageLength(0x0101)同值.
0x0117StripByteConuntsunsigned short/long如果图像格式没有经过压缩 并且 图像被分割存储, 这个值表示每条数据带使用了多少字节的 数据 且 有多个值. 如果图像没有被分割, 它只有一个且表示为图像的所有数据的大小.
0x011aXResolutionunsigned rational1图像的显示/打印分辨率. 很多的数字相机都使用1/72英寸的规格, 但对于个人PC 来讲这个值没有任何意义因为在显示/打印的时候不使用这个值.
0x011bYResolutionunsigned rational1
0x011cPlanarConfigurationunsigned short1如果图像格式是非压缩YCbCr的, 这个值表示YCbCr数据的字节对齐顺序. ‘1’, 表示Y/Cb/Cr值是一个 chunky format, 对于每个子采样像素都是连续的. ‘2’, 则表示Y/Cb/Cr 值被分割存储在 Y plane/Cb plane/Cr plane 格式中.
0x0128ResolutionUnitunsigned short1XResolution(0x011a)/YResolution(0x011b)的单位. ‘1’ 表示英寸, ‘2’ 表示厘米.
0x0201JpegIFOffsetunsigned long1当图像格式是JPEG时, 这个值表示到 JPEG 数据的偏移量.
0x0202JpegIFByteCountunsigned long1当图像格式是JPEG时, 表示JPEG 图像的数据大小.
0x0211YCbCrCoefficientsunsigned rational3当图像格式是YCbCr时, 它表示转换成RGB格式的一个常量值. 通常是’0.299/0.587/0.114′.
0x0212YCbCrSubSamplingunsigned short2当图像格式是YCbCr时 并且 使用子采样(色度数据的剪切值, 所有的数字相机都使用)时, 这个值表示有多少个色度数据被采样了. 首先第一个值表示水平的, 下一个值表示垂直的 采样率.
0x0213YCbCrPositioningunsigned short1当图像格式是YCbCr时 并且 使用子采样(色度数据的剪切值, 所有的数字相机都使用)时, 这个值定义了被采样的像素阵列的色度采样点. ‘1’ 表示像素阵列的中心, ‘2’ 表示基准点(0,0).
0x0214ReferenceBlackWhiteunsigned rational6表示黑点/白点的参考值. 在 YCbCr 格式的情况下, 前两个表示了Y的黑/白, 下两个是 Cb, 最后两个是 Cr. 在 RGB 的情况下, 前两个表示R的黑/白, 下两个是 G, 最后两个是 B.

 

Misc Tags
标签号标签名格式组件数描述
0x00feNewSubfileTypeunsigned long1
0x00ffSubfileTypeunsigned short1
0x012dTransferFunctionunsigned short3
0x013bArtistascii string
0x013dPredictorunsigned short1
0x0142TileWidthunsigned short1
0x0143TileLengthunsigned short1
0x0144TileOffsetsunsigned long
0x0145TileByteCountsunsigned short
0x014aSubIFDsunsigned long
0x015bJPEGTablesundefined
0x828dCFARepeatPatternDimunsigned short2
0x828eCFAPatternunsigned byte
0x828fBatteryLevelunsigned rational1
0x83bbIPTC/NAAunsigned long
0x8773InterColorProfileundefined
0x8824SpectralSensitivityascii string
0x8825GPSInfounsigned long1
0x8828OECFundefined
0x8829Interlaceunsigned short1
0x882aTimeZoneOffsetsigned short1
0x882bSelfTimerModeunsigned short1
0x920bFlashEnergyunsigned rational1
0x920cSpatialFrequencyResponseundefined
0x920dNoiseundefined
0x9211ImageNumberunsigned long1
0x9212SecurityClassificationascii string1
0x9213ImageHistoryascii string
0x9214SubjectLocationunsigned short4
0x9215ExposureIndexunsigned rational1
0x9216TIFF/EPStandardIDunsigned byte4
0xa20bFlashEnergyunsigned rational1
0xa20cSpatialFrequencyResponseunsigned short1
0xa214SubjectLocationunsigned short1

Exif的读取及修改及删除

读取示例

其他工具:

Exif信息的利用

  • 读取图片经纬度匹配地理位置
  • 读取设备,确定图片质量
微信支付标点符 wechat qrcode
支付宝标点符 alipay qrcode

使用Python检测符号及乱码字符

最近在进行关键词的分析,中间涉及到对一些特殊的字符进行过滤的需求。包括带符号的(有部分还是SQL注入),并且存

PHP版本升级记录(7.0到7.4)

服务器上原先安装的版本为PHP 7.0.33, WordPress后台建议安装的最小版本为7.3,所以打算直接

WordPress LaTeX插件更换记录

由于自己的博客要插入很多的公式,所以需要依赖LaTeX插件来帮忙实现。先前一直使用的是WP QuickLaTe

发表评论

电子邮件地址不会被公开。 必填项已用*标注