联系我们 |  设为首页 | 加入收藏 珠海科技网| 珠海专家数据库 | 仪器平台 | 成果转化 | 企业平台 | 科技金融综合服务平台| 免责声明
热门关键词:节能 神舟 人工抗原 政府信息化
 
化工信息检索方法
  一、 STN为什么是查询化工文献的首选  
 
 
STN系统目前有200多个数据库,主要涉及各学科领域及综合性科学技术方面的文献和专利,同时提
供众多公司、供应商等方面的商情信息(如生物商情、化工产品方面等)。它是世界上第一个实现图
形检索的系统,能够实现化学物质的结构检索,且STN中的CA数据库含文摘、标引细,比DIALOG
的CA数据库检索要全。由于CAS是三个服务中心之一,它生产的所有数据库都放在了STN系统中,
因此检索化学化工方面的信息,应首选STN系统。
 
  二、 STN提供了哪些种类的化学文摘  
 
 
STN的CAS提供了6个CA(化学文摘)数据库供选择

·CA/CAPLUS:机时费为$31/小时,检索一个词的费用为$1.48/词;

·HCA/HCAPLUS:机时费为$190/小时,检索单个词的费用为0;

·ZCA/ZCAPLUS:机时费为0,检索单个词的费用为$1.9/词。

 
  三、 CAPLUS数据库  
 
 
  值得一提的是CAPLUS数据库,它是当今世界上最新最全的化学题录型数据库,由美国CAS社制
作,CAPLUS的来源文献包括8000多种国际性刊物、专利、同族专利、技术报告、书籍、会议录、学
位论文等,覆盖了1947年以来(到2002年年底增加到从1907年-)的化学、生物化学、化学工程及相关
学科的所有文献。仅有电子版的期刊和提前于印刷版的网络上登载的文献都包含于内;期刊和会议
录中的文献的引用文献、美国专利、欧洲专利、世界知识产权组织的专利、德国专利中的引用文献
从1999年开始增加于内;1994年10月份开始增加了1600种化学类核心刊物中包含的所有文献,这些
文献的类型CA没有收录,它们是传记、书籍评论、社论、勘误表、致作者的信件、消息公告、产品
评论、会议概要及其他。1600种核心期刊中的文献都在收到这些期刊后的一周内增加到数据库中。
由此可见,CAPLUS的确比CA要全面。
Caplus数据库目前有1800万条记录,每天增加3000条新记录,每周增加14000条索引记录。它是最新
的CA数据库。而且,1947-1966年(第5累计索引-第7累计索引)的记录的图形也被增加于内,这些图
形是TIFF格式,STN Express with Discover!可以通过DISPLAY命令捕获图形,当然,这些图形也
可以在STN ON THE WEB上通过DISPLAY显示。所以,CAPLUS是查询化学类信息的首选。CAS提
供了3个数据库供用户选择:CAPLUS;HCAPLUS;ZCAPLUS,这三个数据库检索方法同CA,但要
注意费用在相应的CA、HCA、ZCA上加收除INTERNET费用($5/小时)后的5%。
 
  四、 查询化学信息的主要工具REG与CA  
 
 
  在STN系统中,美国化学文摘社提供了两个重要的化学文献数据库,即化学物质登记号(REGISTRY)和美国化学文摘数据库(CAplus)。
CAS的REG数据库,是世界上卓越的物质数据库,目前存储了自1957年以来的超过3200万种物质记
录, 其中1800多万种有机和无机物质,以及1400多万种生物序列(截止到2001年10月9日),它包涵了
世界范围内在期刊和专利上报道的有机、无机、金属、合金、矿物、有机金属、元素、同位素、核
微粒、蛋白质、核酸、聚合物等所有的化学物质信息,它已成为化学家、工业企业、情报部门、法
规部门鉴定新的化学物质的世界权威;Caplus数据库收录了自1947年以来世界上发表的98%以上的化
学化工文献约1800多万篇,而且还收录了1600种核心期刊。
在REG文档中,可以使用化学结构图形、化学物质名称、形成聚合物的单体组分、蛋白质/核酸序
列、合金组分及分子式等检索入口查出化学物质登记号,然后转入CAPLUS数据库查出报道该化学物
质的文献及专利信息。REG文档属字典型数据库,记录内容包括化学物质登记号、化学物质名称、
分子式、化学结构图等信息;而CAPLUS文档是题录型数据库,记录内容包括题目、作者、出处、索
引项、文摘等信息。
REG 与 CAPLUS的异同点见下图所示:
 
  五、 REGISTRY数据库  
 
 
1.REG数据库收录范围举例
i有机化合物:Eg.乙炔 acetylene 74-86-2
i聚合物:均聚合物和协聚合物(异分子聚合物)
Eg.聚氯乙烯 PVC 9002-86-2
i酶和原生质(生命科学):Eg.ATP 56-65-5
i药品(成药)、农业化肥:Eg.aspirin 50-78-2
i元素:Eg.gold 7440-57-5
i合金:Eg.steel 12957-69-2
i金属:Eg.iron edta 15275-07-7
i无机物:Eg.water 7732-18-5
2.REG数据库不收录的物质:混合物或者化学结构未知或者是易变的。
举例: gasoline--------汽油
linseed oil-----亚麻油
lipoproteins----脂蛋白
air-------------空气
lava------------熔岩
3.区别几种相似物质的登记号
3.1 位置异构:邻、对、间位,相同的原子不同位置
例: o-xylene 95-47-6 对二甲苯
p-xylene 106-42-3 邻二甲苯
m-xylene 108-38-3 间二甲苯
xylene 1330-20-7 二甲苯
3.2 立体异构:相同的平面结构,不同的立体化学定位(取向)
例: d-ephedrine 321-98-2 右旋
l-ephedrine 299-42-3 左旋
ephedrine 53214-57-6 麻黄素
3.3 盐:相同的酸或酸根,但原子数或原子个数比不同
例: l-ephedrine hydrochloride 50-98-6 盐酸
l-ephedrine sulfate 134-72-5 硫酸
3.4 同位素:相同结构,但包含一个或多个元素的同位素形式
例: methane 74-82-8 甲烷
methane C-14 2772-68-1
3.5 元素和离子:相同结构、不同电荷数
例: Fe elemental iron 7439-89-6
Fe(2+) ferrous iron 15438-36-0
Fe(3+) ferric iron 20074-52-6
 
  六、 通过REG得到化学物质登记号的途径:三种方法  
 
 

· 通过查询化学名/CN

· 通过查询分子式/MF

· 通过查询结构式

1.通过查询化学名/CN得到RN号
注意:在REGISTRY数据库中查找化学名,用/CN后缀,CN包括了该物质所有的标引名和商标名,且通常使用EXPAND命令在REG数据库中扩展化学名,查看该化学物质名称标引形式是否存在/CN这个字段中。
1.1 输入化学名称时的注意事项
1.1.1 上标、下标、斜体字母或数字一律照写
例:Tricycol[6.2.0.02,10]decane
则 =>e tricyclo(6.2.0.02,10)decane/cn
例:Dichloromethane-d2
则 =>e Dichloromethane-d2/cn
例:trans,trans-1,4-Diphenyl-1,3-butadiene
则 =>e trans,trans-1,4-Diphenyl-1,3-butadiene/cn
1.1.2 希腊字母、拉丁字母,一律用英文写出,前后各加一点
例:α,β,β-Trifluostyrene
则 =>e .alpha.,.beta.,.beta.-trifluostyrene/cn
1.1.3 右上角撇号、带撇号的字母或数字,一律用引号引起所有“N,N′…”
例:N,N′-Dimethyl-p-phenylenediamine
则:=>e “n,n'-dimethyl-p-phenylenediamine”/cn
1.1.4 方括号[ ],改为( ),且用引号引起所有
例:6,7-dihydro-1H-cyclopenta[gh]perimidine
则 =>e “6,7-dihydro-1h-cyclopenta(gh)perimidine”/cn
1.1.5 查找混合物时要component registry numbers(混合物登记号)
前提:该混合物包含截然不同的成分,且这些成分定义明确,无异构,若存在异构,则必须用RN号表示每一个成分例:
=>S 58-08-2/CRN AND 50-78-2/CRN
1.1.6 混合物中总共有几个组份,在REG库的基本索引中被定义为/NC(number of components)
例:2/NC, NC<2, NC<=2, 2-3/NC
1.1.7 检索化学名片段/BI
前提:通常我们只是知道化学名称的一个片段,用它来检索查找线索。化学名称片段一般存在于基本索引字段,基本索引由具有化学特征的专门术语的片段构成,是化学名称片段。
例:3,4-bis(2,2,2-trifluoroethoxy)benzamide而 3 4 bis 2 tri fluoro ethoxy benz amide以上片段存在于/BI基本索引中
1.2 用/CN查找化学名称小结
1.2.1 如果是完整的化学名称i用/CN字段检索
i用/EXPAND看检索的可能性
1.2.2 如果是化学名称片段
i用/BI字段,即Basic Index基本索引字段

2.通过查询分子式/MF得到RN号
注意:用分子式/MF查找某化学物质,会得到不只一个答案,因为有很多同分异构体,这时需要增加该物质化学名称中专指的片段词(name fragments),记住:片段词存在于/BI中。
2.1 输入分子式时的注意事项
2.1.1遵循Hill系统命名法,无机化合物,无C,则一般按字母顺序排序
例: NaOH ===> HNAO/MF
2.1.2 包含有C,则先C后H,其它元素按字顺排
例: C8H18 C2AG2N8 C9H8CL4N8O
2.1.3 输入分子式的特例:句点断开,句点断开的物质一般是盐、复合物、混合物、聚合物、水合物
2.1.3.1 Salts of Acids---酸的盐原则:
去掉金属离子,用H-根代替还原成酸,保持中性,将酸和金属之间用句点隔开,把含C的酸写在前面。
例:Sodium Acetata 醋酸钠


2.1.3.2 Salts of Amines---胺盐
原则:去掉胺的氢根,添加到阴离子中,保持中性,把含C的分子式写在前面
例:Trimethylammonium Chloride


2.1.3.3 Polymers---聚合物
例:Polystyrene 聚苯乙烯,它是H2C=CH的聚合物

MF:(C8H8)x

2.1.3.4 Copolymer---共聚物
例:Copolymer of Vinyl acetate(CH3CO-O-CH=CH2)
Vinyl chloride(H2C=CH-CL)
Vinyl fluoride(H2C=CH-F)
MF:(C4H6O2.C2H3CL.C2H3F)x
原则:含C个数多的物质写在前面,其次是H,其他元素按字母顺序、元素个数降序排列。
2.2 用/MF查找分子式小结
2.2.1 如果是完整的分子式且包括多成分物质:
i使用/MF字段
i使用Expand命令,扩展分子式看可行性
例:查找C4H6O2.C2H3CL.C2H3F的共聚物
=>b reg
=>e (C4H6O2.C2H3CL.C2H3F)x/mf
2.2.2 如果是单一的分子式,或盐、混合物、共聚物等多种化合物中的一部分i使用/BI字段,即不仅查出该物质,还查出许多包括含该物质的酸、盐等,较全面
例:C10H10N14O18
则 =>e C10H10N14O18
2.2.3 对比:

/MF和
/BI

C16H32O2
C16H32O2

C16H32O2.H3N C16H32O2
and H3N

C16H32O2.NA C16H32O2
and NA

2.2.4 一般元素检索
·单个元素用数字索引,例:11/C,8/F
·/PG表示一族元素在元素周期表中的位置,例A7/PG
·/ELS表示分子式中出现的元素,例:F/ELS
·/ELC表示不同元素的个数,例:4/ELC
·/ELF表示已知元素的组成,例:C F FE O/ELF
·/ATC表示分子式中总共原子的个数,例:23/ATC

3.通过查询结构式得到RN号
3.1 步骤:
1)利用STN EXPRESS 绘出结构,保存为一个文件
2)进入REGISTRY数据库
3)上传结构文件,获得组号L#,显示结构图D L#
4)检索物质结构
5)进入CA数据库,检索相关文献
3.2 检索结构式的一般方法
3.2.1 格式:

S  L1

EXACT

SAMPLE

 

 

 

组号

FAMILY

FULL

 

 

 

 

SSS

两种检索范围

 

 

 

 

 

三种结构类型

 



三种结构类型:EXACT:确切、精确检索,但H包括D、T
              FAMILY:族性检索,包括包含该物质的混合物,盐,共聚物
              SSS:子结构检索,包括含取代基的所检物质
两种检索范围:SAMPLE:REGISTRY数据库5%的内容,检索该范围内容免费
              FULL:全部REGISTRY数据库内容,需付费。

 
  七、 检索REG和化学文摘CA的步骤  
 
 
=>b reg (首先进入化学物质登记号数据库)
=> e  3-chloropropanediol/cn (在化学物质名称字段/CN展开化学物质名称)
E1 1  3-CHLOROPROPANAMIDE/CN
E2 1  3-CHLOROPROPANE-1,2-DIOL DIPALMITATE/CN
E3 1  -->3-CHLOROPROPANEDIOL/CN
E4 1  3-CHLOROPROPANENITRILE/CN
E5 1  3-CHLOROPROPANESULFINYL CHLORIDE/CN
E6 1  3-CHLOROPROPANESULFONAMIDE/CN
E7 1  3-CHLOROPROPANESULFONYL CHLORIDE/CN
E8 1  3-CHLOROPROPANETHIOL/CN
E9 1  3-CHLOROPROPANETHIOL ANION/CN
E10 1  3-CHLOROPROPANOIC ACID/CN
E11 1  3-CHLOROPROPANOIC ACID 2-METHYLPHENYL /CN
E12  1  3-CHLOROPROPANOIC ACID METHYL ESTER/CN .
=>s e3 (选择 E3)
L1  1 3-chloropropanediol/cn (系统给出组号L1)
=> d scan (用免费显示指令D SCAN查看一下结果,是否符合要求)
L1  1 ANSWERS REGISTRY COPYRIGHT 2001 ACS
IN  1,2-Propanediol, 3-chloro-(6CI, 7CI, 8CI, 9CI)
MF  C3 H7 Cl O2
CI  COM

ALL ANSWERS HAVE BEEN SCANNED
=>b  ca (转入CA)
=>s  l1 (查找有关制备该物质的文献)
=>  s l1/spn (仅查找合成该物质方面的文献)
L3  54 L1/SPN
=>  s l1/pur (仅查找提纯该物质方面的文献)
L4  3 L1/PUR
检索化学文献原则:通过REGISTRY找到化学物质的登记号(最准确),没有找到的采用化学名称、分子式、结构检索确定其RN号,再进入CA/CAPLUS正式库,把相应的文摘调出来。推荐:先进REG库,S 50-00-0,得到组号L1,然后再进CA,S L1,因为REG库检索RN号是免费的,再进入CA库S L1也是免费的,而如果直接进入CA,S 50-00-0,则收取检索一个词的费用$1.49;检索与物质有关的信息(如甲醛的工业生产),用RN号检索最准确,如果条数教多,则用ROLES、关键词再加以限定;检索非物质信息(如废水的利用、某种工艺),则用关键词检索。
 
  八、 CAS的ROLES职能符  
 
 

1.功能 :ROLES是描述所有物质更确切的信息,它能将化学物质(登记号或REG文档产生的L#)限定在某一方面,如制备、应用等。ROLES有7个上位类(1967年来的文献),另外还有3个单独的上位类,38 个下位类(1994年10月以后的文献),上位类用4个字母表示,下位类用3个字母表示。
2.ROLES代码表:
ANST Analytical Study
ANT Analyte
AMX Analytical Matrix
ARG Analytical Reagent Use *
ARU Analytical Role, Unclassified

BIOL Biological Study
ADV Adverse Effect, Including Toxicity
AGR Agricultural Use *
BMF Bioindustrial Manufacture *
BAC Biological Activity or Effector
Except Adverse
BOC Biological Occurrence
BPR Biological Process *
BUU Biological Use, Unclassified
BSU Biological Study, Unclassified
ARG Analytical Reagent Use *
AGR Agricultural Use *
FFD Food or Feed Use *
MFM Metabolic Formation *
THU Therapeutic Use *

PREP Preparation
BMF Bioindustrial Manufacture *
BPN Biosynthetic Preparation *
BYP Byproduct
IMF Industrial Manufacture
PUR Purification or Recovery
PNU Preparation, Unclassified
SPN Synthetic Preparation

PROC Process
BPR Biological Process *
GPR Geological or Astronomical Process
PEP Physical, Engineering, or Chemical Process
REM Removal or Disposal

USES Uses
BPN Biosynthetic Preparation *
BUU Biological Use, Unclassified *
CAT Catalyst Use
DEV Device Component Use
FFD Food or Feed Use *
MOA Modifier or Additive Use
NUU Nonbiological Use, Unclassified
POF Polymer in Formulation
TEM Technical or Engineered Material Use
THU Therapeutic Use *

FORM Formation, Nonpreparative
FMU Formation, Unclassified         三个单独的上位类
GFM Geological or Astronomical Formation   MSC Miscellaneous   其他
MFM Metabolic Formation *          PRP Properties    性质
RCT Reactant     反应的原料
OCCU Occurrence
BOC Biological Occurrence *
GOC Geological or Astronomical Occurrence
OCU Occurrence, Unclassified
POL Pollutant

3.ROLES举例
=> b reg
=> e gum arabic/cn
=> s e3
L1 1 “gum arabic”/cn (表示该物质存在且有RN号)
=> b caplus
=> s  L1         (此时,SEARCH的是RN号)
L2 260 L1
=> s L1/uses
L3 72 L1/USES

 
  九、 CA中使用/BI检索注意事项  
 
 
1. /BI组成:TI、AB、ST、IT中的单个词。
2. /BI中CAS的缩写词:CAS缩写词在AB、ST及IT字段的修饰短语处使用缩写,但注意缩写从不出现在TI或受控词字段。
3. /BI中的首字母缩写词:
eg. ELISA emzyme-linked immunosorbent assay
4. /BI中的左截词:/BI中允许使用左、右截词
5. 连字符("-")可代替空格
例:=>S X-RAY 可以检出X-RAY 和X RAY
例:=>S AROMATIC ALDEHYDES等于=>S AROMATIC(W)ALDEHYDES等于=>S AROMATIC()ALDEHYDES
 
  十、 其他化学信息数据库  
 
 
1.CAOLD:
1907~1966比较早的CA,包含近300多万条记录,含文摘,是TIFF格式;检索方法同CA
2.MARPAT:
提供检索化学专利时的MARKUSH(马库氏结构),来源是CA收录的1988-今的专利中包含有机或有机金属结构的记录,提供未实现物质和预言结构的检索。目前有近40万条可检索的结构,每周更新。
3.CASREACT
有机化学反应库,来源是CA收录的1985~今的期刊和1991~今的专利中有机物质合成部分,包括有机金属、自然物质、生物催化、生物分子等。目前有超过400万条的一步和多步反应,每周更新。以产物、反应物、试剂为检索入口,可检索反应条件、产量和催化剂,利用该库可进行:
*基于结构的反应检索,所有的反应物、试剂、产物都提供结构检索;
*给所有的反应参与者都提供RN号检索;
*可检索功能团和功能团种类名称;
*CA的书目型信息都可检索
4.CIN(Chemical Industry Notes)
化学工业札记,书目型数据库, 1974~今,主要是商情方面,来源是美国和非美国家的期刊、贸易杂志、报纸、快报、政府出版物、特殊报告。可检索索引词、文摘、RN号、化学名。
5.CHEMCATS(Chemical Catalogs Online)
化学药品目录在线,书目型数据库,1993~今,主要提供商业性的化学物质和其世界范围内的生产提供者,记录包括RN号、Beilstein RN号、结构图、性质、常规信息、价格,也包括公司名、地址、供应信息,例:价目表、产品和服务、包装方面、航运、安全、处理方面的信息。目前有来自全世界614多个提供商的712个目录下的超过269万条记录,提供超过333万种产品。
6.CHEMLIST(Regulated CHEMicals LISTing)
化学品的法规库,词典型数据库,1979~今,包括美、加、欧洲、澳大利亚、日本、韩国等国家的有毒物质的法规。可检索化学名、法规信息和RN号。目前有超过22万种化学物质,每周更新。
7.CSCORP(ChemSources Company Directory)和CSCHEM(ChemSources Chemicals)
化学制品的供应商数据库(目录型数据库)和化学制品信息数据库(目录型数据库),前者包含化学产品供应商及其总部、分部、分支地址、电话等,该库与后者配合使用,CSCHEM提供CSCORP库提供商提供的化学产品的信息,可用RN号检索,包含203,000种化学制品及他们的135个国家的供应商。即 CSCORP提供公司信息,CSCHEM提供化学制品、供应商信息。
8.BEILSTEIN数据库
该数据库包含有机物质的制备、反应及理化性质等信息。其数据库来源于BEILSTEIN有机化学手册。可以通过结构图、所有的文本信息及性质字段来检索。
数据库生产商:BEILSTEIN信息系统公司
收录时间范围:1779-
文档规模:7.7百万多条记录
更新日期:周期性更新
文档类型:结构型和数值型数据
文档内容:有机化学
语种:英语,有些字段有德语
9.HODOC数据库
该数据库包含最常用的有机化合物的物化数及光谱数据。物理数据包括:沸点,熔点,密度,折射指数,光学旋转度,溶解度,结晶特性以及分子量等。其数据库来源于有机化合物数据的CRC手册。可以 通过化学物质信息,性质信息以及CAS登记号来检索。
数据库生产商:CRC出版社
收录时间范围:有机化合物数据的CRC手册(HODOC II)
文档规模:25,580多个化合物
更新日期:周期性更新
文档类型:数值型数据
文档内容:化学和物理性质数据
语 种:英语
10.GMELIN数据库
该数据库包含1817至1975年间GMELIN无机和有机金属化学手册中有关尖锐性评论和有价值的数据信息,还包括1970年以来涉及无机,物理以及有机金属化学方面的100多种期刊。可以通过CAS登记号、GMELIN登记号、化学结构、分子式、化学物理性质、题录信息等来检索。
数据库生产商:GMELIN研究所
收录时间范围:1817-1975选自GMELIN手册;1975-1997选自期刊
文档规模:1,070,350多条记录
更新日期:周期性更新
文档类型:结构型及数值型数据
文档内容:无机及有机金属化学
语 种:英语,有些字段是德语
11.DIPPR数据库
该数据库包含商业上重要的化学物质性质常数和温度从属特性。其数据库的数据来源于美国化学工程研究所的物理性质数据设计研究所。可以通过化学名称、分子式、性质信息及CAS登记号来检索。
数据库生产商:美国化学工程研究所
收录时间范围:1982~
文档规模:1,630多条记录
更新日期:每年更新
文档类型:数值型
文档内容:物理性质数据
语 种:英语
12.DETHERM
该数据库包含化学工业中各种工艺设计的重要热物理数据,包括500多个纯化合物和混合物以及17,000多个无机和有机物质的性质信息。DETHERM数据库包括两种类型的文献,即事实型和文献型。可以通过题录、标引词、性质代码、物质信息、文摘和CAS登记号来检索。
数据库生产商:DETHERM
收录时间范围:1819~
文档规模:427,630多条记录带有数据表格,52,010多条记录带有题录信息
更新日期:每年两次
文档类型:数值型、事实型和题录型数据
文档内容:热物理性质
语 种:英语
此外,还有一些专业性的数据库可以查找性质信息,如PLASPEC数据库用于查找聚合物材料的性质信息;ASMDTA数据库用于查找塑料,有色金属和无色金属及其合金的性质信息等。
 
 
珠海市生产力促进中心 主办
地址:广东省珠海市香洲区新光里3街23号1栋A201室 电话:2155012 2155017 ICP备案号:粤ICP备05145468号

粤公网安备 44040202000327号