Microsoft HTML Object Library

HTML 对象库

    获取网页数据必须使用HTML对象库,可在“引用”窗体中添加对“Microsoft HTML Object Library”的引用。HTML对象库提供了大量的对象,这些对象和各类HTML标记相对应,如熟悉的“<a>”、“<Table>”、“< body>”和“<form>”标记,一些常用HTML对象的知识点如下所述:
 
(1)HTMLAnchorElement对象:该对象代表网页中超级链接(即“<a>”)标记,其常用属性和方法如下所述:
  href:该属性用于设置链接的目标。
  id:该属性用于设置链接的标识。
  innerHTML:该属性返回链接的HTML代码。
  innerText:该属性返回链接的文字。
  target:该属性用于设置链接的方式。
  click:该方法可模拟单击链接。

(2)HTMLBody对象:该对象代表网页中正文(即“<body>”)标记,其常用属性和方法如下所述:
  background:该属性返回网页的背景图片。
  bgColor:该属性返回网页的背景色。
  innerText:该属性返回网页包含的所有文字。

(3)HTMLDocument对象:该对象包含网页的整体,如所有的链接、表格对象等,其常用属性和方法如下所述:
  anchors:该属性返回网页包含的所有链接对象。
  applets:该属性返回网页包含的Applet插件对象。
  body:该属性返回网页的正文对象。
  forms:该属性返回网页包含的所有表单对象。
  frames:该属性返回网页包含的所有框架对象。
  images:该属性返回网页包含的所有图片对象。
  scripts:该属性返回网页包含的所有脚本对象。

(4)HTMLElementCollection对象:该对象可获取各类HTML对象的集合,如网页的表格或表单的集合,随后即可遍历该集合来选择所需的对象,其常用属性和方法如下所述:
  length:该属性返回集合的成员数。
  item:该属性返回集合中的指定成员。

(5)HTMLTable对象:该对象可获取HTML表格对象,也是获取网页信息的核心,其常用属性和方法如下所述:
  cols:该属性返回表格的列数。
  rows:该属性返回表格的行集合对象。
  deleteRow:该方法用于删除表格行。
  insertRow:该方法用于删除表格列。

(6)HTMLTableCell对象:该对象可获取HTML表格中的单元格对象(即“<TD>”标记中包含的内容),在控制表格对象后,需结合该对象来进一步获取所需的网页文字,其常用属性和方法如下所述:
  cellIndex:该属性返回单元格的编号。
  className:该属性返回单元格的类名。
  colSpan:该属性返回单元格的列合并数。
  innerHTML:该属性返回单元格的HTML代码。
  innerText:该属性返回单元格包含的文字。
  rowSpan:该属性返回单元格的行合并数。
  vAlign:该属性返回单元格的垂直对齐方式。

(7)HTMLTableCol对象:该对象可获取HTML表格中的列对象,其常用属性和方法如下所述:
  innerText:该属性返回表格列包含的文字。
  span:该属性返回表格列的合并数。

(8)HTMLTableRow对象:该对象可获取HTML表格中的行对象(即“<TR>”标记中包含的内容),在控制表格对象后,需遍历表格行并在此基础上访问特定单元格对象来获取所需的网页文字。该对象的常用属性和方法如下所述:
  cells:该属性返回行包含的单元格集合对象。
  rowIndex:该属性返回行的编号。
  vAlign:该属性返回行的垂直对齐方式。

(9)BSTR   

 
 
 


上一篇: windows 2003 停止服务 重启出现Generic Host Process
下一篇: SQL添加表字段
文章来自: 本站原创
引用通告: 查看所有引用 | 我要引用此文章
Tags:
相关日志:
评论: 2 | 引用: 0 | 查看次数: 1907
发表评论
昵 称:
密 码: 游客发言不需要密码.
邮 箱: 邮件地址支持Gravatar头像,邮箱地址不会公开.
网 址: 输入网址便于回访.
内 容:
验证码:
选 项:
虽然发表评论不用注册,但是为了保护您的发言权,建议您注册帐号.
字数限制 1000 字 | UBB代码 关闭 | [img]标签 关闭