Chromium网页URL加载过程分析

发表于 5年以前  | 总阅读数:2099 次

Chromium在Browser进程中为网页创建了一个Frame Tree之后,会将网页的URL发送给Render进程进行加载。Render进程接收到网页URL加载请求之后,会做一些必要的初始化工作,然后请求Browser进程下载网页的内容。Browser进程一边下载网页内容,一边又通过共享内存将网页内容传递给Render进程解析,也就是创建DOM Tree。本文接下来就分析网页URL的加载过程。

Render进程之所以要请求Browser进程下载网页的内容,是因为Render进程没有网络访问权限。出于安全考虑,Chromium将Render进程启动在一个受限环境中,使得Render进程没有网络访问权限。那为什么不是Browser进程主动下载好网页内容再交给Render进程解析呢?

这是因为Render进程是通过WebKit加载网页URL的,WebKit不关心自己所在的进程是否有网络访问权限,它通过特定的接口访问网络。这个特定接口由WebKit的使用者,也就是Render进程中的Content模块实现。Content模块在实现这个接口的时候,会通过IPC请求Browser进程下载网络的内容。这种设计方式使得WebKit可以灵活地使用:既可以在有网络访问权限的进程中使用,也可以在没有网络访问权限的进程中使用,并且使用方式是统一的。

从前面Chromium Frame Tree创建过程分析一文可以知道,Browser进程中为要加载的网页创建了一个Frame Tree之后,会向Render进程发送一个类型为FrameMsg_Navigate的IPC消息。Render进程接收到这个IPC消息之后,处理流程如图1所示:

图1 网页URL加载过程

Render进程执行了一些初始化工作之后,就向Browser进程发送一个类型为ResourceHostMsg_RequestResource的IPC消息。Browser进程收到这个IPC消息之后,就会通过HTTP协议请求Web服务器将网页的内容返回来。请求得到响应后,Browser进程就会创建一块共享内存,并且通过一个类型为ResourceMsg_SetDataBuffer的IPC消息将这块共享内存传递给Render进程的。

以后每当下载到新的网页内容,Browser进程就会将它们写入到前面创建的共享内存中去,并且发送Render进程发送一个类型为ResourceMsg_DataReceived的IPC消息。Render进程接收到这个IPC消息之后,就会从共享内存中读出Browser进程写入的内容,并且进行解析,也就是创建一个DOM Tree。这个过程一直持续到网页内容下载完成为止。

接下来,我们就从Render进程接收类型为FrameMsg_Navigate的IPC消息开始分析网页URL的加载过程。Render进程是通过RenderFrameImpl类的成员函数OnMessageReceived接收类型为FrameMsg_Navigate的IPC消息的,如下所示:

bool RenderFrameImpl::OnMessageReceived(const IPC::Message& msg) {
      ......

      bool handled = true;
      IPC_BEGIN_MESSAGE_MAP(RenderFrameImpl, msg)
        IPC_MESSAGE_HANDLER(FrameMsg_Navigate, OnNavigate)
        ......
      IPC_END_MESSAGE_MAP()

      return handled;
    }

这个函数定义在文件external/chromium_org/content/renderer/render_frame_impl.cc中。

RenderFrameImpl类的成员函数OnMessageReceived将类型为FrameMsg_Navigate的IPC消息分发给另外一个成员函数OnNavigate处理,后者的实现如下所示:

void RenderFrameImpl::OnNavigate(const FrameMsg_Navigate_Params& params) {
      ......

      bool is_reload = RenderViewImpl::IsReload(params);
      ......

      WebFrame* frame = frame_;
      ......

      if (is_reload) {
        ......
      } else if (params.page_state.IsValid()) {
        ......
      } else if (!params.base_url_for_data_url.is_empty()) {
        ......
      } else {
        // Navigate to the given URL.
        WebURLRequest request(params.url);
        ......

        frame->loadRequest(request);

        ......
      }

      ......
    }

这个函数定义在文件external/chromium_org/content/renderer/render_frame_impl.cc中。

从前面Chromium Frame Tree创建过程分析一文可以知道,RenderFrameImpl类的成员变量frame_指向的是一个WebLocalFrameImpl对象。如果当前正在处理的RenderFrameImpl对象还没有加载过URL,并且当前要加载的URL不为空,RenderFrameImpl类的成员函数OnNavigate会调用成员变量frame_指向的WebLocalFrameImpl对象的成员函数loadRequest加载指定的URL。

WebLocalFrameImpl类的成员函数loadRequest的实现如下所示:

void WebLocalFrameImpl::loadRequest(const WebURLRequest& request)
    {
        ......
        const ResourceRequest& resourceRequest = request.toResourceRequest();

        if (resourceRequest.url().protocolIs("javascript")) {
            loadJavaScriptURL(resourceRequest.url());
            return;
        }

        frame()->loader().load(FrameLoadRequest(0, resourceRequest));
    }

这个函数定义在文件external/chromium_org/third_party/WebKit/Source/web/WebLocalFrameImpl.cpp中。

如果参数request描述的URL指定的协议是"javascript",那么表示要加载的是一段JavaScript。这时候WebLocalFrameImpl类的成员函数loadRequest会调用另外一个成员函数loadJavaScriptURL加载这段JavaScript。

在其它情况下,WebLocalFrameImpl类的成员函数loadRequest首先调用成员函数frame获得成员变量m_frame描述的一个LocalFrame对象,接着又调用这个LocalFrame对象的成员函数loader获得其成员变量m_loader描述的一个FrameLoader对象。有了这个FrameLoader对象之后,就调用它的成员函数load加载参数request描述的URL。

WebLocalFrameImpl类的成员变量m_frame描述的LocalFrame对象和LocalFrame类的成员变量m_loader描述的FrameLoader对象的创建过程,可以参考前面Chromium Frame Tree创建过程分析一文。接下来我们继续分析FrameLoader类的成员函数load的实现,如下所示:

void FrameLoader::load(const FrameLoadRequest& passedRequest)
    {
        ......

        FrameLoadRequest request(passedRequest);
        ......

        FrameLoadType newLoadType = determineFrameLoadType(request);
        NavigationAction action(request.resourceRequest(), newLoadType, request.formState(), request.triggeringEvent());
        ......

        loadWithNavigationAction(action, newLoadType, request.formState(), request.substituteData(), request.clientRedirect());

        ......
    }

这个函数定义在文件external/chromium_org/third_party/WebKit/Source/core/loader/FrameLoader.cpp中。

FrameLoader类的成员函数load主要是调用另外一个成员函数loadWithNavigationAction加载参数passedRequest描述的URL。

FrameLoader类的成员函数loadWithNavigationAction的实现如下所示:

void FrameLoader::loadWithNavigationAction(const NavigationAction& action, FrameLoadType type, PassRefPtrWillBeRawPtr<FormState> formState, const SubstituteData& substituteData, ClientRedirectPolicy clientRedirect, const AtomicString& overrideEncoding)
    {
        ......

        const ResourceRequest& request = action.resourceRequest();
        ......

        m_policyDocumentLoader = client()->createDocumentLoader(m_frame, request, substituteData.isValid() ? substituteData : defaultSubstituteDataForURL(request.url()));
        ......

        m_provisionalDocumentLoader = m_policyDocumentLoader.release();
        ......

        m_provisionalDocumentLoader->startLoadingMainResource();
    }

这个函数定义在文件external/chromium_org/third_party/WebKit/Source/core/loader/FrameLoader.cpp中。

FrameLoader类的成员函数loadWithNavigationAction首先调用成员函数client获得一个FrameLoaderClientImpl对象,接着再调用这个FrameLoaderClientImpl对象的成员函数createDocumentLoader为参数action描述的URL创建了一个WebDataSourceImpl对象,并且保存在成员变量m_policyDocumentLoader中。关于FrameLoader类的成员函数client和FrameLoaderClientImpl类的成员函数createDocumentLoader的实现,可以参考前面Chromium Frame Tree创建过程分析一文。

FrameLoader类的成员函数loadWithNavigationAction接下来又将成员变量m_policyDocumentLoader描述的WebDataSourceImpl对象转移到另外一个成员变量m_provisionalDocumentLoader中,最后调用这个WebDataSourceImpl对象的成员函数startLoadingMainResource加载参数action描述的URL。

WebDataSourceImpl类的成员函数startLoadingMainResource是从父类DocumentLoader继承下来的,它的实现如下所示:

void DocumentLoader::startLoadingMainResource()
    { 
        ......

        FetchRequest cachedResourceRequest(request, FetchInitiatorTypeNames::document, mainResourceLoadOptions);
        m_mainResource = m_fetcher->fetchMainResource(cachedResourceRequest, m_substituteData);
        ......

        m_mainResource->addClient(this); 

        ......
    }

这个函数定义在文件external/chromium_org/third_party/WebKit/Source/core/loader/DocumentLoader.cpp中。

从前面Chromium Frame Tree创建过程分析一文可以知道,DocumentLoader类的成员变量m_fetcher描述的是一个ResourceFetcher对象,DocumentLoader类的成员函数startLoadingMainResource调用这个ResourceFetcher对象的成员函数fetchMainResource请求加载本地变量cachedResourceRequest描述的资源。这个资源描述的即为上一步指定要加载的URL。

ResourceFetcher类的成员函数fetchMainResource执行结束后,会返回一个RawResource对象。这个RawResource对象保存在WebDataSourceImpl类的成员变量m_mainResource中。这个RawResource对象描述的是一个异步加载的资源,DocumentLoader类的成员startLoadingMainResource调用它的成员函数addClient将当前正在处理的DocumentLoader对象添加到它的内部去,用来获得异步加载的资源数据,也就是本地变量cachedResourceRequest描述的URL对应的网页内容。

RawResource类的成员函数addClient是从父类Resource继承下来的,它的实现如下所示:

void Resource::addClient(ResourceClient* client)
    {
        if (addClientToSet(client))
            didAddClient(client);
    }

这个函数定义在文件external/chromium_org/third_party/WebKit/Source/core/fetch/Resource.cpp中。

Resource类的成员函数addClient调用另外一个成员函数addClientToSet将参数client描述的一个DocumentLoader对象保存在内部,如下所示:

bool Resource::addClientToSet(ResourceClient* client)
    {
        ......

        m_clients.add(client);
        return true;
    }

这个函数定义在文件external/chromium_org/third_party/WebKit/Source/core/fetch/Resource.cpp中。

Resource类的成员函数addClientToSet将参数client描述的一个DocumentLoader保存在成员变量m_clients描述的一个Hash Set中,以便当前正在处理的Resource对象描述的网页内容从Web服务器下载回来的时候,可以交给它处理。

接下来我们继续分析WebDataSourceImpl类的成员函数startLoadingMainResource调用成员变量m_fetcher描述的ResourceFetcher对象的成员函数fetchMainResource加载本地变量cachedResourceRequest描述的URL的过程,如下所示:

ResourcePtr<RawResource> ResourceFetcher::fetchMainResource(FetchRequest& request, const SubstituteData& substituteData)
    {
        ......
        return toRawResource(requestResource(Resource::MainResource, request));
    }

这个函数定义在文件external/chromium_org/third_party/WebKit/Source/core/fetch/ResourceFetcher.cpp中。

ResourceFetcher类的成员函数fetchMainResource调用另外一个成员函数requestResource加载参数request描述的URL。ResourceFetcher类的成员函数requestResource会返回一个RawResource对象给调用者,即ResourceFetcher类的成员函数fetchMainResource。后者又会将这个RawResource对象返回给它的调用者。

ResourceFetcher类的成员函数requestResource的实现如下所示:

ResourcePtr<Resource> ResourceFetcher::requestResource(Resource::Type type, FetchRequest& request)
    {
        ......

        KURL url = request.resourceRequest().url();
        ......

        const RevalidationPolicy policy = determineRevalidationPolicy(type, request.mutableResourceRequest(), request.forPreload(), resource.get(), request.defer(), request.options());
        switch (policy) {
        ......
        case Load:
            resource = createResourceForLoading(type, request, request.charset());
            break;
        .....
        }

        ......

        if (resourceNeedsLoad(resource.get(), request, policy)) {
            ......

            if (!m_documentLoader || !m_documentLoader->scheduleArchiveLoad(resource.get(), request.resourceRequest()))
                resource->load(this, request.options());

            ......
        }

        ......

        return resource;
    }

这个函数定义在文件external/chromium_org/third_party/WebKit/Source/core/fetch/ResourceFetcher.cpp中。

ResourceFetcher类的成员函数requestResource首先调用成员函数createResourceForLoading为参数request描述的URL创建一个RawResource对象,如下所示:

ResourcePtr<Resource> ResourceFetcher::createResourceForLoading(Resource::Type type, FetchRequest& request, const String& charset)
    {
        ......

        ResourcePtr<Resource> resource = createResource(type, request.resourceRequest(), charset);

        ......
        return resource;
    }

这个函数定义在文件external/chromium_org/third_party/WebKit/Source/core/fetch/ResourceFetcher.cpp中。

ResourceFetcher类的成员函数createResourceForLoading调用函数createResource根据参数type和request创建一个RawResource对象,如下所示:

static Resource* createResource(Resource::Type type, const ResourceRequest& request, const String& charset)
    {
        switch (type) {
        ......
        case Resource::MainResource:
        case Resource::Raw:
        case Resource::TextTrack:
        case Resource::Media:
            return new RawResource(request, type);
        ......
        }

        ......
        return 0;
    }

这个函数定义在文件external/chromium_org/third_party/WebKit/Source/core/fetch/ResourceFetcher.cpp中。

从前面的调用过程可以知道,参数type的值等于Resource::MainResource,因此函数createResource创建的是一个RawResource对象。

回到ResourceFetcher类的成员函数requestResource中,它调用成员函数createResourceForLoading为参数request描述的URL创建了一个RawResource对象之后,接下来又调用成员函数resourceNeedsLoad判断该URL是否需要进行加载。如果需要进行加载,那么ResourceFetcher类的成员函数requestResource又会调用成员变量m_documentLoader描述的一个DocumentLoader对象的成员函数scheduleArchiveLoad判断要加载的URL描述的是否是一个存档文件。如果不是,那么就会调用前面创建的RawResource对象的成员函数load从Web服务器下载对应的网页内容。

我们假设request描述的URL需要进行加载,并且不是一个存档文件,因此接下来我们继续分析RawResource类的成员函数load的实现。RawResource类的成员函数load是从父类Resource继承下来的,它的实现如下所示:

void Resource::load(ResourceFetcher* fetcher, const ResourceLoaderOptions& options)
    {
        ......

        ResourceRequest request(m_resourceRequest);
        ......

        m_loader = ResourceLoader::create(fetcher, this, request, options);
        m_loader->start();
    }

这个函数定义在文件external/chromium_org/third_party/WebKit/Source/core/fetch/Resource.cpp中。

Resource类的成员变量m_resourceRequest描述的是要加载的URL,Resource类的成员函数load首先调用ResourceLoader类的静态成员函数create为其创建一个ResourceLoader对象,如下所示:

PassRefPtr<ResourceLoader> ResourceLoader::create(ResourceLoaderHost* host, Resource* resource, const ResourceRequest& request, const ResourceLoaderOptions& options)
    {
        RefPtr<ResourceLoader> loader(adoptRef(new ResourceLoader(host, resource, options)));
        loader->init(request);
        return loader.release();
    }

这个函数定义在文件external/chromium_org/third_party/WebKit/Source/core/fetch/ResourceLoader.cpp中。

从这里可以看到,ResourceLoader类的静态成员函数create创建的是一个ResourceLoader对象。这个ResourceLoader对象经过初始化之后,会返回给调用者。

回到Resource类的成员函数load中,它为要加载的URL创建了一个ResourceLoader对象之后,会调用这个ResourceLoader对象的成员函数start开始加载要加载的URL,如下所示:

void ResourceLoader::start()
    {
        ......

        m_loader = adoptPtr(blink::Platform::current()->createURLLoader());
        ......
        blink::WrappedResourceRequest wrappedRequest(m_request);
        m_loader->loadAsynchronously(wrappedRequest, this);
    }

这个函数定义在文件external/chromium_org/third_party/WebKit/Source/core/fetch/ResourceLoader.cpp中。

ResourceLoader类的成员函数start首先调用由Chromium的Content模块实现的一个blink::Platform接口的成员函数createURLLoader创建一个WebURLLoaderImpl对象,接着再调用这个WebURLLoaderImpl对象的成员函数loadAsynchronously对象成员变量m_request描述的URL进行异步加载。

Chromium的Content模块的BlinkPlatformImpl类实现了blink::Platform接口,它的成员函数createURLLoader的实现如下所示:

WebURLLoader* BlinkPlatformImpl::createURLLoader() {
      return new WebURLLoaderImpl;
    }

这个函数定义在文件external/chromium_org/content/child/blink_platform_impl.cc中。

从这里可以看到,BlinkPlatformImpl类的成员函数createURLLoader创建的是一个WebURLLoaderImpl对象。这个WebURLLoaderImpl对象会返回给调用者。

接下来我们继续分析WebURLLoaderImpl类的成员函数loadAsynchronously异步加载一个URL的过程,如下所示:

void WebURLLoaderImpl::loadAsynchronously(const WebURLRequest& request,
                                              WebURLLoaderClient* client) {
      ......

      context_->set_client(client);
      context_->Start(request, NULL);
    }

这个函数定义在文件external/chromium_org/content/child/web_url_loader_impl.cc中。

从前面的调用过程可以知道,参数client描述的是一个ResourceLoader对象。这个ResourceLoader对象会保存在WebURLLoaderImpl类的成员变量content_描述的一个WebURLLoaderImpl::Context对象的内部。这是通过调用WebURLLoaderImpl::Context类的成员函数set_client实现的,如下所示:

class WebURLLoaderImpl::Context : public base::RefCounted<Context>,
                                      public RequestPeer {
     public:
      ......

      void set_client(WebURLLoaderClient* client) { client_ = client; }

     private:
      ......

      WebURLLoaderClient* client_;

      ......
    };

这个函数定义在文件external/chromium_org/content/child/web_url_loader_impl.cc中。

WebURLLoaderImpl::Context类的成员函数set_client将参数client描述的ResourceLoader对象保存在成员变量client_中。

回到WebURLLoaderImpl类的成员函数loadAsynchronously中,它接下来会继续调用成员变量content_描述的一个WebURLLoaderImpl::Context对象的成员函数Start加载参数request描述的URL,如下所示:

void WebURLLoaderImpl::Context::Start(const WebURLRequest& request,
                                          SyncLoadResponse* sync_load_response) {
      ......

      GURL url = request.url();
      ......

      RequestInfo request_info;
      ......
      request_info.url = url;
      ......
      bridge_.reset(ChildThread::current()->resource_dispatcher()->CreateBridge(
          request_info));

      ......

      if (bridge_->Start(this)) {
        AddRef();  // Balanced in OnCompletedRequest
      } else {
        bridge_.reset();
      }
    }

这个函数定义在文件external/chromium_org/content/child/web_url_loader_impl.cc中。

WebURLLoaderImpl::Context类的成员函数Start首先调用当前Render进程的一个ChildThread单例的成员函数resource_dispatcher获得一个ResourceDispatcher对象,如下所示:

class CONTENT_EXPORT ChildThread
        : public IPC::Listener,
          public IPC::Sender,
          public NON_EXPORTED_BASE(mojo::ServiceProvider) {
     public:
      ......

      ResourceDispatcher* resource_dispatcher() const {
        return resource_dispatcher_.get();
      }

      ......

     private:
      ......

      // Handles resource loads for this process.
      scoped_ptr<ResourceDispatcher> resource_dispatcher_;

      ......
    };

这个函数定义在文件external/chromium_org/content/child/child_thread.h中。

ChildThread类的成员函数resource_dispatcher返回的是成员变量resource_dispatcher_描述的一个ResourceDispatcher对象。

回到WebURLLoaderImpl::Context类的成员函数Start中,它获得了一个ResourceDispatcher对象之后,接着调用这个ResourceDispatcher对象的成员函数CreateBridge创建一个IPCResourceLoaderBridge对象,如下所示:

ResourceLoaderBridge* ResourceDispatcher::CreateBridge(
        const RequestInfo& request_info) {
      return new IPCResourceLoaderBridge(this, request_info);
    }

这个函数定义在文件external/chromium_org/content/child/resource_dispatcher.cc中。

从这里可以看到,ResourceDispatcher类的成员函数CreateBridge创建的是一个IPCResourceLoaderBridge对象,并且会将这个IPCResourceLoaderBridge对象返回给调用者。

回到WebURLLoaderImpl::Context类的成员函数Start中,它获得了一个IPCResourceLoaderBridge对象之后,接着调用这个IPCResourceLoaderBridge对象的成员函数Start加载参数request描述的URL,如下所示:

bool IPCResourceLoaderBridge::Start(RequestPeer* peer) {
      ......

      // generate the request ID, and append it to the message
      request_id_ = dispatcher_->AddPendingRequest(peer,
                                                   request_.resource_type,
                                                   request_.origin_pid,
                                                   frame_origin_,
                                                   request_.url,
                                                   request_.download_to_file);

      return dispatcher_->message_sender()->Send(
          new ResourceHostMsg_RequestResource(routing_id_, request_id_, request_));
    }

这个函数定义在文件external/chromium_org/content/child/resource_dispatcher.cc中。

IPCResourceLoaderBridge类的成员变量dispatcher_描述的是一个ResourceDispatcher对象,IPCResourceLoaderBridge类的成员函数Start首先调用这个ResourceDispatcher对象的成员函数AddPendingRequest将参数peer描述的一个WebURLLoaderImpl::Context对象保存在内部,如下所示:

int ResourceDispatcher::AddPendingRequest(RequestPeer* callback,
                                              ResourceType::Type resource_type,
                                              int origin_pid,
                                              const GURL& frame_origin,
                                              const GURL& request_url,
                                              bool download_to_file) {
      // Compute a unique request_id for this renderer process.
      int id = MakeRequestID();
      pending_requests_[id] = PendingRequestInfo(callback,
                                                 resource_type,
                                                 origin_pid,
                                                 frame_origin,
                                                 request_url,
                                                 download_to_file);
      return id;
    }

这个函数定义在文件external/chromium_org/content/child/resource_dispatcher.cc中。

ResourceDispatcher类的成员函数AddPendingRequest首先调用成员函数MakeRequestID生成一个Request ID,接着将参数callback描述的一个WebURLLoaderImpl::Context对象封装在一个PendingRequestInfo对象中,并且以上述Request ID为键值,将这个PendingRequestInfo对象保存在成员变量pending_requests_描述的一个Hash Map中。

回到IPCResourceLoaderBridge类的成员函数Start中,它接下来调用成员变量dispatcher_描述的ResourceDispatcher对象的成员函数message_sender获得一个IPC::Sender对象,并且通过这个IPC::Sender对象向Browser进程发送一个类型为ResourceHostMsg_RequestResource的IPC消息,用来请求Browser进程下载成员变量request_描述的URL对应的网页的内容。

在Browser进程中,类型为ResourceHostMsg_RequestResource的IPC消息是由ResourceDispatcherHostImpl类的成员函数OnMessageReceived进行接收的,如下所示:

bool ResourceDispatcherHostImpl::OnMessageReceived(
        const IPC::Message& message,
        ResourceMessageFilter* filter) {
      ......
      bool handled = true;
      IPC_BEGIN_MESSAGE_MAP(ResourceDispatcherHostImpl, message)
        IPC_MESSAGE_HANDLER(ResourceHostMsg_RequestResource, OnRequestResource)
        ......
        IPC_MESSAGE_UNHANDLED(handled = false)
      IPC_END_MESSAGE_MAP()

      ......
    }

这个函数定义在文件external/chromium_org/content/browser/loader/resource_dispatcher_host_impl.cc中。

ResourceDispatcherHostImpl类的成员函数OnMessageReceived将类型为ResourceHostMsg_RequestResource的IPC消息分发给另外一个成员函数OnRequestResource处理,后者的实现如下所示:

void ResourceDispatcherHostImpl::OnRequestResource(
        int routing_id,
        int request_id,
        const ResourceHostMsg_Request& request_data) {
      BeginRequest(request_id, request_data, NULL, routing_id);
    }

这个函数定义在文件external/chromium_org/content/browser/loader/resource_dispatcher_host_impl.cc中。

ResourceDispatcherHostImpl类的成员函数OnRequestResource调用另外一个成员函数BeginRequest开始下载参数request_data描述的URL对应的网页内容,后者的实现如下所示:

void ResourceDispatcherHostImpl::BeginRequest(
        int request_id,
        const ResourceHostMsg_Request& request_data,
        IPC::Message* sync_result,  // only valid for sync
        int route_id) {
      ......

      // Construct the request.
      net::CookieStore* cookie_store =
          GetContentClient()->browser()->OverrideCookieStoreForRenderProcess(
              child_id);
      scoped_ptr<net::URLRequest> new_request;
      new_request = request_context->CreateRequest(
          request_data.url, request_data.priority, NULL, cookie_store);
      ......

      scoped_ptr<ResourceHandler> handler(
           CreateResourceHandler(
               new_request.get(),
               request_data, sync_result, route_id, process_type, child_id,
               resource_context));

      if (handler)
        BeginRequestInternal(new_request.Pass(), handler.Pass());
    }

这个函数定义在文件external/chromium_org/content/browser/loader/resource_dispatcher_host_impl.cc中。

ResourceDispatcherHostImpl类的成员函数BeginRequest首先从参数request_data取出要下载网页内容的URL,接着又将该URL封装在一个URLRequest对象中。

ResourceDispatcherHostImpl类的成员函数BeginRequest接下来又调用另外一个成员函数CreateResourceHandler创建了一个AsyncResourceHandler对象。这个AsyncResourceHandler对象用来异步接收和处理从Web服务器下载回来的网页内容。

ResourceDispatcherHostImpl类的成员函数CreateResourceHandler的实现如下所示:

scoped_ptr<ResourceHandler> ResourceDispatcherHostImpl::CreateResourceHandler(
        net::URLRequest* request,
        const ResourceHostMsg_Request& request_data,
        IPC::Message* sync_result,
        int route_id,
        int process_type,
        int child_id,
        ResourceContext* resource_context) {
      // Construct the IPC resource handler.
      scoped_ptr<ResourceHandler> handler;
      if (sync_result) {
        ......

        handler.reset(new SyncResourceHandler(request, sync_result, this));
      } else {
        handler.reset(new AsyncResourceHandler(request, this));

        // The RedirectToFileResourceHandler depends on being next in the chain.
        if (request_data.download_to_file) {
          handler.reset(
              new RedirectToFileResourceHandler(handler.Pass(), request));
        }
      }

      ......

      // Install a CrossSiteResourceHandler for all main frame requests.  This will
      // let us check whether a transfer is required and pause for the unload
      // handler either if so or if a cross-process navigation is already under way.
      bool is_swappable_navigation =
          request_data.resource_type == ResourceType::MAIN_FRAME;
      // If we are using --site-per-process, install it for subframes as well.
      if (!is_swappable_navigation &&
          CommandLine::ForCurrentProcess()->HasSwitch(switches::kSitePerProcess)) {
        is_swappable_navigation =
            request_data.resource_type == ResourceType::SUB_FRAME;
      }
      if (is_swappable_navigation && process_type == PROCESS_TYPE_RENDERER)
        handler.reset(new CrossSiteResourceHandler(handler.Pass(), request));

      // Insert a buffered event handler before the actual one.
      handler.reset(
          new BufferedResourceHandler(handler.Pass(), this, request));

      ......

      handler.reset(
          new ThrottlingResourceHandler(handler.Pass(), request, throttles.Pass()));

      return handler.Pass();
    }

这个函数定义在文件external/chromium_org/content/browser/loader/resource_dispatcher_host_impl.cc中。

从前面的调用过程可以知道,参数sync_result的值等于NULL,因此ResourceDispatcherHostImpl类的成员函数CreateResourceHandler首先创建了一个AsyncResourceHandler对象,保存在本地变量handler中,表示要通过异步方式下载参数request描述的URL。

接下来ResourceDispatcherHostImpl类的成员函数CreateResourceHandler又会根据情况创建其它的Handler对象。这些Handler对象会依次连接在一起。其中,后面创建的Handler对象位于前面创建的Handler对象的前面。下载回来的网页内容将依次被这些Handler对象处理。这意味着下载回来的网页内容最后会被最先创建的AsyncResourceHandler对象进行处理。为了简单起见,后面我们只分析这个AsyncResourceHandler对象处理下载回来的网页内容的过程,也就是假设ResourceDispatcherHostImpl类的成员函数CreateResourceHandler返回给调用者的是一个AsyncResourceHandler对象。

回到ResourceDispatcherHostImpl类的成员函数BeginRequest中,它最后调用另外一个成员函数BeginRequestInternal下载本地变量new_request描述的URL对应的网页内容,如下所示:

void ResourceDispatcherHostImpl::BeginRequestInternal(
        scoped_ptr<net::URLRequest> request,
        scoped_ptr<ResourceHandler> handler) {
      ......

      ResourceRequestInfoImpl* info =
          ResourceRequestInfoImpl::ForRequest(request.get());
      ......

      linked_ptr<ResourceLoader> loader(
          new ResourceLoader(request.Pass(), handler.Pass(), this));

      .....

      StartLoading(info, loader);
    }

这个函数定义在文件external/chromium_org/content/browser/loader/resource_dispatcher_host_impl.cc中。

ResourceDispatcherHostImpl类的成员函数BeginRequestInternal将参数request描述的URL和参数handler描述的AsyncResourceHandler对象封装在一个ResourceLoader对象后,调用另外一个成员函数StartLoading开始加载参数request描述的URL。

ResourceDispatcherHostImpl类的成员函数StartLoading的实现如下所示:

void ResourceDispatcherHostImpl::StartLoading(
        ResourceRequestInfoImpl* info,
        const linked_ptr<ResourceLoader>& loader) {
      ......

      loader->StartRequest();
    }

这个函数定义在文件external/chromium_org/content/browser/loader/resource_dispatcher_host_impl.cc中。

ResourceDispatcherHostImpl类的成员函数StartLoading主要是调用参数loader描述的ResourceLoader对象的成员函数StartRequest开始加载其内部封装的URL。

ResourceLoader类的成员函数StartRequest的实现如下所示:

void ResourceLoader::StartRequest() {
      ......

      // Give the handler a chance to delay the URLRequest from being started.
      bool defer_start = false;
      if (!handler_->OnWillStart(request_->url(), &defer_start)) {
        Cancel();
        return;
      }

      if (defer_start) {
        deferred_stage_ = DEFERRED_START;
      } else {
        StartRequestInternal();
      }
    }

这个函数定义在external/chromium_org/content/browser/loader/resource_loader.cc中。

ResourceLoader类的成员变量handler_描述的便是前面我们假设ResourceDispatcherHostImpl类的成员函数CreateResourceHandler返回的AsyncResourceHandler对象。ResourceLoader类的成员函数StartRequest调用这个AsyncResourceHandler对象的成员函数OnWillStart询问是要取消、延迟、还是马上下载当前正在处理的ResourceLoader对象封装的URL对应的网页内容。

我们假设是第三种情况,这时候ResourceLoader类的成员函数StartRequest就会马上调用另外一个成员函数StartRequestInternal下载当前正在处理的ResourceLoader对象封装的URL对应的网页内容。

ResourceLoader类的成员函数StartRequestInternal的实现如下所示:

void ResourceLoader::StartRequestInternal() {
      ......

      request_->Start();

      ......
    }

这个函数定义在external/chromium_org/content/browser/loader/resource_loader.cc中。

ResourceLoader类的成员变量request_描述的是前面在ResourceDispatcherHostImpl类的成员函数BeginRequest中创建的一个URLRequest对象。这个URLRequest对象封装了要下载的URL。ResourceLoader类的成员函数StartRequestInternal通过调用这个URLRequest对象的成员函数Start就可以启动下载网页的过程了。

URLRequest类是Chromium在Net模块中提供的一个类,用来执行具体的网络操作,也就是根据约定的协议请求Web服务器返回指定URL对应的网页的内容。这个过程我们留给读者自行分析。

Web服务器响应了请求之后,Chromium的Net模块会调用ResourceLoader类的成员函数OnResponseStarted,它的实现如下所示:

void ResourceLoader::OnResponseStarted(net::URLRequest* unused) {
      ......

      if (request_->status().is_success()) {
        StartReading(false);  // Read the first chunk.
      } 

      ......
    }

这个函数定义在external/chromium_org/content/browser/loader/resource_loader.cc中。

ResourceLoader类的成员函数OnResponseStarted检查Web服务器的响应是否成功,例如Web服务器是否根据HTTP协议返回了200响应。如果成功的话,那么接下来就会调用另外一个成员函数StartReading读出第一块数据。

ResourceLoader类的成员函数StartReading的实现如下所示:

void ResourceLoader::StartReading(bool is_continuation) {
      int bytes_read = 0;
      ReadMore(&bytes_read);

      ......

      if (!is_continuation || bytes_read <= 0) {
        OnReadCompleted(request_.get(), bytes_read);
      } else {
        // Else, trigger OnReadCompleted asynchronously to avoid starving the IO
        // thread in case the URLRequest can provide data synchronously.
        base::MessageLoop::current()->PostTask(
            FROM_HERE,
            base::Bind(&ResourceLoader::OnReadCompleted,
                       weak_ptr_factory_.GetWeakPtr(),
                       request_.get(),
                       bytes_read));
      }
    }

这个函数定义在external/chromium_org/content/browser/loader/resource_loader.cc中。

ResourceLoader类的成员函数StartReading调用成员函数ReadMore读取Web服务器返回来的数据,读出来的数据大小保存在本地变量bytes_read中。

ResourceLoader类的成员函数ReadMore的实现如下所示:

void ResourceLoader::ReadMore(int* bytes_read) {
      ......

      scoped_refptr<net::IOBuffer> buf;
      int buf_size;
      if (!handler_->OnWillRead(&buf, &buf_size, -1)) {
        Cancel();
        return;
      }

      ......

      request_->Read(buf.get(), buf_size, bytes_read);

      ......
    }

这个函数定义在external/chromium_org/content/browser/loader/resource_loader.cc中。

ResourceLoader类的成员函数ReadMore首先调用成员变量handler_描述的一个AsyncResourceHandler对象的成员函数OnWillRead获取一个Buffer。这个Buffer用来保存从Web服务器返回来的数据。这些数据可以通过调用ResourceLoader类的成员变量reqeust_描述的一个URLRequest对象的成员函数Read获得。

AsyncResourceHandler对象的成员函数OnWillRead的实现如下所示:

bool AsyncResourceHandler::OnWillRead(scoped_refptr<net::IOBuffer>* buf,
                                          int* buf_size,
                                          int min_size) {
      ......

      if (!EnsureResourceBufferIsInitialized())
        return false;

      ......
      char* memory = buffer_->Allocate(&allocation_size_);
      .....

      *buf = new DependentIOBuffer(buffer_.get(), memory);
      *buf_size = allocation_size_;

      ......

      return true;
    }

这个函数定义在文件external/chromium_org/content/browser/loader/async_resource_handler.cc中。

AsyncResourceHandler对象的成员函数OnWillRead首先调用成员函数EnsureResourceBufferIsInitialized确保成员变量buffer_指向了一块共享内存,然后再从这块共享内存中分配一块大小等于成员变量allocation_size_的值的缓冲区,用来返回给调用者保存从Web服务器返回来的数据。

AsyncResourceHandler类的成员函数EnsureResourceBufferIsInitialized的实现如下所示:

bool AsyncResourceHandler::EnsureResourceBufferIsInitialized() {
      if (buffer_.get() && buffer_->IsInitialized())
        return true;

      ......

      buffer_ = new ResourceBuffer();
      return buffer_->Initialize(kBufferSize,
                                 kMinAllocationSize,
                                 kMaxAllocationSize);
    }

这个函数定义在文件external/chromium_org/content/browser/loader/async_resource_handler.cc中。

AsyncResourceHandler类的成员函数EnsureResourceBufferIsInitialized首先检查成员变量buffer_是否指向了一个ResourceBuffer对象,并且这个ResourceBuffer对象描述的共享内存是否已经创建。

如果AsyncResourceHandler类的成员变量buffer_还没有指向一个ResourceBuffer对象,或者指向了一个ResourceBuffer对象,但是这个ResourceBuffer对象描述的共享内存还没有创建,那么AsyncResourceHandler类的成员函数EnsureResourceBufferIsInitialized就会创建一个ResourceBuffer对象保存在成员变量buffer_中,并且调用这个ResourceBuffer对象的成员函数Initialize创建一块大小为kBufferSize的共享内存。这块共享内存每次可以分配出来的缓冲区最小值为kMinAllocationSize,最大值为kMaxAllocationSize。

在Android平台上,调用ResourceBuffer类的成员函数Initialize创建的共享内存实际上是匿名共享内存。匿名共享内存可以通过Binder机制在两个进程之间进行共享。这一点可以参考前面Android系统匿名共享内存Ashmem(Anonymous Shared Memory)在进程间共享的原理分析一文。这样Browser进程就可以通过这块匿名共享内存将下载回来的网页内容传递给Render进程处理。

这一步执行完成后,回到ResourceLoader类的成员函数StartReading中,如果没有读出数据(表明数据已经下载完毕),或者参数is_continuation的值等于false(表示读出来的是第一个数据块),那么ResourceLoader类的成员函数StartReading就会调用成员函数OnReadCompleted马上进行下一步处理。其余情况下,为了避免当前(网络)线程被阻塞,ResourceLoader类的成员函数StartReading并不会马上调用成员函数OnReadCompleted处理读出来的数据,而是延后一个消息处理,也就是等ResourceLoader类的成员函数StartReading返回到Chromium的Net模块之后再作处理。

接下来我们继续分析ResourceLoader类的成员函数OnReadCompleted的实现,如下所示:

void ResourceLoader::OnReadCompleted(net::URLRequest* unused, int bytes_read) {
      ......

      CompleteRead(bytes_read);

      ......

      if (bytes_read > 0) {
        StartReading(true);  // Read the next chunk.
      } else {
        // URLRequest reported an EOF. Call ResponseCompleted.
        DCHECK_EQ(0, bytes_read);
        ResponseCompleted();
      }
    }

这个函数定义在external/chromium_org/content/browser/loader/resource_loader.cc中。

ResourceLoader类的成员函数OnReadCompleted首先调用成员函数CompleteRead处理当前读出来的数据,数据的大小由参数bytes_read描述。如果当前读出来的数据的大小大于0,那么就表示数据还没读完,这时候就需要调用前面分析的成员函数StartReading继续进行读取。注意,这时候传递成员函数StartReading的参数为true,表示不是第一次读取Web服务器返回来的数据。

另一方面,如果当前读出来的数据的大小小于等于0,那么就说明Web服务器已经把所有的数据都返回来了,这时候ResourceLoader类的成员函数OnReadCompleted就调用另外一个成员函数ResponseCompleted结束读取数据。

接下来我们继续分析ResourceLoader类的成员函数CompleteRead的实现,以便了解Browser进程将下载回来的网页内容返回给Render进程处理的过程,如下所示:

void ResourceLoader::CompleteRead(int bytes_read) {
      ......

      bool defer = false;
      if (!handler_->OnReadCompleted(bytes_read, &defer)) {
        Cancel();
      } 

      ......
    }

这个函数定义在external/chromium_org/content/browser/loader/resource_loader.cc中。

ResourceLoader类的成员函数CompleteRead将读取出来的数据交给成员变量handler_描述的一个AsyncResourceHandler对象处理,这是通过调用它的成员函数OnReadCompleted实现的。

AsyncResourceHandler类的成员函数OnReadCompleted的实现如下所示:

bool AsyncResourceHandler::OnReadCompleted(int bytes_read, bool* defer) {
      ......

      if (!sent_first_data_msg_) {
        base::SharedMemoryHandle handle;
        int size;
        if (!buffer_->ShareToProcess(filter->PeerHandle(), &handle, &size))
          return false;
        filter->Send(new ResourceMsg_SetDataBuffer(
            GetRequestID(), handle, size, filter->peer_pid()));
        sent_first_data_msg_ = true;
      }

      int data_offset = buffer_->GetLastAllocationOffset();

      int64_t current_transfer_size = request()->GetTotalReceivedBytes();
      int encoded_data_length = current_transfer_size - reported_transfer_size_;
      reported_transfer_size_ = current_transfer_size;

      filter->Send(new ResourceMsg_DataReceived(
          GetRequestID(), data_offset, bytes_read, encoded_data_length));

      ......
    }

这个函数定义在文件external/chromium_org/content/browser/loader/async_resource_handler.cc。

当AsyncResourceHandler类的成员变量sent_first_data_msg_的值等于false的时候,表示当前正在处理的AsyncResourceHandler对象还没有向Render进程返回过从Web服务器下载回来的网页内容。这时候AsyncResourceHandler类的成员函数OnReadCompleted首先要向Render进程发送一个类型为ResourceMsg_SetDataBuffer的IPC消息。这个IPC消息会将AsyncResourceHandler类的成员变量buffer_描述的共享内存传递给Render进程,以便Render进程接下来可以通过这块共享内存读取从Web服务器下载回来的网页内容。

最后,AsyncResourceHandler类的成员函数OnReadCompleted再向Render进程发送一个类型为ResourceMsg_DataReceived的IPC消息。这个IPC消息告诉Render进程从前面所描述的共享内存的什么位置开始读取多少数据。有了这些数据之后,Render进程就可以构建网页的DOM Tree了。

接下来我们就继续分析Render进程接收和处理类型为ResourceMsg_SetDataBuffer和ResourceMsg_DataReceived的IPC消息的过程。

Render进程是通过ResourceDispatcher类的成员函数DispatchMessage接收类型为ResourceMsg_SetDataBuffer和ResourceMsg_DataReceived的IPC消息的,如下所示:

void ResourceDispatcher::DispatchMessage(const IPC::Message& message) {
      IPC_BEGIN_MESSAGE_MAP(ResourceDispatcher, message)
        ......
        IPC_MESSAGE_HANDLER(ResourceMsg_SetDataBuffer, OnSetDataBuffer)
        IPC_MESSAGE_HANDLER(ResourceMsg_DataReceived, OnReceivedData)
        ......
      IPC_END_MESSAGE_MAP()
    }

这个函数定义在文件external/chromium_org/content/child/resource_dispatcher.cc中。

从这里可以看到,ResourceDispatcher类的成员函数DispatchMessage把类型为ResourceMsg_SetDataBuffer的IPC消息分发给成员函数OnSetDataBuffer处理,把类型为ResourceMsg_DataReceived的IPC消息分发给成员函数OnReceivedData处理。

ResourceDispatcher类的成员函数OnSetDataBuffer的实现如下所示:

void ResourceDispatcher::OnSetDataBuffer(int request_id,
                                             base::SharedMemoryHandle shm_handle,
                                             int shm_size,
                                             base::ProcessId renderer_pid) {
      ......
      PendingRequestInfo* request_info = GetPendingRequestInfo(request_id);
      ......

      request_info->buffer.reset(
          new base::SharedMemory(shm_handle, true));  // read only

      bool ok = request_info->buffer->Map(shm_size);
      ......

      request_info->buffer_size = shm_size;
    }

这个函数定义在文件external/chromium_org/content/child/resource_dispatcher.cc中。

从前面的分析可以知道,Render进程在请求Browser进程下载指定URL对应的网页内容之前,会创建一个PendingRequestInfo对象。这个PendingRequestInfo对象以一个Request ID为键值保存在ResourceDispatcher类的内部。这个Request ID即为参数request_id描述的Request ID。因此,ResourceDispatcher类的成员函数OnSetDataBuffer可以通过参数request_id获得一个PendingRequestInfo对象。有了这个PendingRequestInfo对象之后,ResourceDispatcher类的成员函数OnSetDataBuffer就根据参数shm_handle描述的句柄创建一个ShareMemory对象,保存在它的成员变量buffer中。

ResourceDispatcher类的成员函数OnSetDataBuffer最后调用上述ShareMemory对象的成员函数Map即可将Browser进程传递过来的共享内存映射到当前进程的地址空间来,这样以后就可以直接从这块共享内存读出Browser进程下载回来的网页内容。

ResourceDispatcher类的成员函数OnReceivedData的实现如下所示:

void ResourceDispatcher::OnReceivedData(int request_id,
                                            int data_offset,
                                            int data_length,
                                            int encoded_data_length) {
      ......
      PendingRequestInfo* request_info = GetPendingRequestInfo(request_id);
      ......
      if (request_info && data_length > 0) {
        ......
        linked_ptr<base::SharedMemory> retain_buffer(request_info->buffer);
        ......

        const char* data_start = static_cast<char*>(request_info->buffer->memory());
        ......
        const char* data_ptr = data_start + data_offset;
        ......

        // Check whether this response data is compliant with our cross-site
        // document blocking policy. We only do this for the first packet.
        std::string alternative_data;
        if (request_info->site_isolation_metadata.get()) {
          request_info->blocked_response =
              SiteIsolationPolicy::ShouldBlockResponse(
                  request_info->site_isolation_metadata, data_ptr, data_length,
                  &alternative_data);
          request_info->site_isolation_metadata.reset();

          // When the response is blocked we may have any alternative data to
          // send to the renderer. When |alternative_data| is zero-sized, we do not
          // call peer's callback.
          if (request_info->blocked_response && !alternative_data.empty()) {
            data_ptr = alternative_data.data();
            data_length = alternative_data.size();
            encoded_data_length = alternative_data.size();
          }
        }

        if (!request_info->blocked_response || !alternative_data.empty()) {
          if (request_info->threaded_data_provider) {
            request_info->threaded_data_provider->OnReceivedDataOnForegroundThread(
                data_ptr, data_length, encoded_data_length);
            // A threaded data provider will take care of its own ACKing, as the
            // data may be processed later on another thread.
            send_ack = false;
          } else {
            request_info->peer->OnReceivedData(
                data_ptr, data_length, encoded_data_length);
          }
        }

        ......
      }

      ......
    }

这个函数定义在文件external/chromium_org/content/child/resource_dispatcher.cc中。

ResourceDispatcher类的成员函数OnReceivedData首先获得参数request_id对应的一个PendingRequestInfo对象,保存在本地变量request_info中。有了这个PendingRequestInfo对象之后,就可以根据参数data_offset和data_length从它的成员变量buffer描述的共享内存中获得Browser进程下载回来的网页内容。

如果这是一个跨站(cross-site)请求下载回来的内容,ResourceDispatcher类的成员函数OnReceivedData会调用SiteIsolationPolicy类的静态成员函数ShouldBlockResponse根据Cross-Site Document Blocking Policy决定是否需要阻止下载回来的内容在当前Render进程中加载。关于Chromium的Cross-Site Document Blocking Policy,可以参考Site IsolationBlocking Cross-Site Documents for Site Isolation这两篇文章。

如果SiteIsolationPolicy类的静态成员函数ShouldBlockResponse表明要阻止下载回来的内容在当前Render进程中加载,那么本地变量request_info指向的PendingRequestInfo对象的成员变量blocked_response的值就会等于true。这时候如果SiteIsolationPolicy类的静态成员函数ShouldBlockResponse还返回了Alternative Data,那么这个Alternative Data就会替换下载回来的网页内容交给WebKit处理。

如果SiteIsolationPolicy类的静态成员函数ShouldBlockResponse没有阻止下载回来的内容在当前Render进程中加载,或者阻止的同时也提供了Alternative Data,那么ResourceDispatcher类的成员函数OnReceivedData接下来继续判断本地变量request_info指向的PendingRequestInfo对象的成员变量threaded_data_provider是否指向了一个ThreadedDataProvider对象。如果指向了一个ThreadedDataProvider对象,那么ResourceDispatcher类的成员函数OnReceivedData会将下载回来的网页内容交给这个ThreadedDataProvider对象的成员函数OnReceivedDataOnForegroundThread处理。否则的话,下载回来的网页内容将会交给本地变量request_info指向的PendingRequestInfo对象的成员变量peer描述的一个WebURLLoaderImpl::Context对象的成员函数OnReceivedData处理。

WebKit在请求Chromium的Content模块下载指定URL对应的网页内容时,可以指定将下载回来的网页内容交给一个后台线程进行接收和解析,这时候本地变量request_info指向的PendingRequestInfo对象的成员变量threaded_data_provider就会指向一个ThreadedDataProvider对象。这个ThreadedDataProvider对象就会将下载回来的网页内容交给一个后台线程接收和解析。我们不考虑这种情况,因此接下来我们继续分析WebURLLoaderImpl::Context类的成员函数OnReceivedData的实现,如下所示:

void WebURLLoaderImpl::Context::OnReceivedData(const char* data,
                                                   int data_length,
                                                   int encoded_data_length) {
      ......

      if (ftp_listing_delegate_) {
        // The FTP listing delegate will make the appropriate calls to
        // client_->didReceiveData and client_->didReceiveResponse.
        ftp_listing_delegate_->OnReceivedData(data, data_length);
      } else if (multipart_delegate_) {
        // The multipart delegate will make the appropriate calls to
        // client_->didReceiveData and client_->didReceiveResponse.
        multipart_delegate_->OnReceivedData(data, data_length, encoded_data_length);
      } else {
        client_->didReceiveData(loader_, data, data_length, encoded_data_length);
      }
    }

这个函数定义在文件external/chromium_org/content/child/web_url_loader_impl.cc中。

当从Web服务器返回来的网页内容的MIME类型为"text/vnd.chromium.ftp-dir"时,WebURLLoaderImpl::Context类的成员变量ftp_listing_delegate_指向一个FtpDirectoryListingResponseDelegate对象。这时候从Web服务器返回来的网页内容是一些FTP目录,上述FtpDirectoryListingResponseDelegate对象对这些网页内容进行一些排版处理后,再交给WebKit处理,也就是ResourceLoader类的成员变量client_描述的一个ResourceLoader对象处理。

当从Web服务器返回来的网页内容的MIME类型为"multipart/x-mixed-replace"时,WebURLLoaderImpl::Context类的成员变量multipart_delegate_指向一个MultipartResponseDelegate对象。这时候从Web服务器返回来的网页内容包含若干个数据块,每一个数据块都有单独的MIME类型,并且它们之间通过一个Boundary String。上述MultipartResponseDelegate对象根据Boundary String解析出每一数据块之后,再交给WebKit处理,也就是ResourceLoader类的成员变量client_描述的一个ResourceLoader对象处理。

在其余情况下,WebURLLoaderImpl::Context类的成员函数OnReceivedData直接把Web服务器返回来的网页内容交给WebKit处理,也就是调用ResourceLoader类的成员变量client_描述的一个ResourceLoader对象的成员函数didReceiveData进行处理。

至此,我们就分析完成Chromium下载指定URL对应的网页内容的过程了。下载回来的网页内容将由WebKit进行处理,也就是由ResourceLoader类的成员函数didReceiveData进行处理。这个处理过程即为网页内容的解析过程,解析后就会得到一棵DOM Tree。有了DOM Tree之后,接下来就可以对下载回来的网页内容进行渲染了。在接下来的一篇文章中,我们再详细分析WebKit根据网页内容生成DOM Tree的过程,敬请关注!更多的信息也可以关注老罗的新浪微博:http://weibo.com/shengyangluo

 相关推荐

刘强东夫妇:“移民美国”传言被驳斥

京东创始人刘强东和其妻子章泽天最近成为了互联网舆论关注的焦点。有关他们“移民美国”和在美国购买豪宅的传言在互联网上广泛传播。然而,京东官方通过微博发言人发布的消息澄清了这些传言,称这些言论纯属虚假信息和蓄意捏造。

发布于:1年以前  |  808次阅读  |  详细内容 »

博主曝三大运营商,将集体采购百万台华为Mate60系列

日前,据博主“@超能数码君老周”爆料,国内三大运营商中国移动、中国电信和中国联通预计将集体采购百万台规模的华为Mate60系列手机。

发布于:1年以前  |  770次阅读  |  详细内容 »

ASML CEO警告:出口管制不是可行做法,不要“逼迫中国大陆创新”

据报道,荷兰半导体设备公司ASML正看到美国对华遏制政策的负面影响。阿斯麦(ASML)CEO彼得·温宁克在一档电视节目中分享了他对中国大陆问题以及该公司面临的出口管制和保护主义的看法。彼得曾在多个场合表达了他对出口管制以及中荷经济关系的担忧。

发布于:1年以前  |  756次阅读  |  详细内容 »

抖音中长视频App青桃更名抖音精选,字节再发力对抗B站

今年早些时候,抖音悄然上线了一款名为“青桃”的 App,Slogan 为“看见你的热爱”,根据应用介绍可知,“青桃”是一个属于年轻人的兴趣知识视频平台,由抖音官方出品的中长视频关联版本,整体风格有些类似B站。

发布于:1年以前  |  648次阅读  |  详细内容 »

威马CDO:中国每百户家庭仅17户有车

日前,威马汽车首席数据官梅松林转发了一份“世界各国地区拥车率排行榜”,同时,他发文表示:中国汽车普及率低于非洲国家尼日利亚,每百户家庭仅17户有车。意大利世界排名第一,每十户中九户有车。

发布于:1年以前  |  589次阅读  |  详细内容 »

研究发现维生素 C 等抗氧化剂会刺激癌症生长和转移

近日,一项新的研究发现,维生素 C 和 E 等抗氧化剂会激活一种机制,刺激癌症肿瘤中新血管的生长,帮助它们生长和扩散。

发布于:1年以前  |  449次阅读  |  详细内容 »

苹果据称正引入3D打印技术,用以生产智能手表的钢质底盘

据媒体援引消息人士报道,苹果公司正在测试使用3D打印技术来生产其智能手表的钢质底盘。消息传出后,3D系统一度大涨超10%,不过截至周三收盘,该股涨幅回落至2%以内。

发布于:1年以前  |  446次阅读  |  详细内容 »

千万级抖音网红秀才账号被封禁

9月2日,坐拥千万粉丝的网红主播“秀才”账号被封禁,在社交媒体平台上引发热议。平台相关负责人表示,“秀才”账号违反平台相关规定,已封禁。据知情人士透露,秀才近期被举报存在违法行为,这可能是他被封禁的部分原因。据悉,“秀才”年龄39岁,是安徽省亳州市蒙城县人,抖音网红,粉丝数量超1200万。他曾被称为“中老年...

发布于:1年以前  |  445次阅读  |  详细内容 »

亚马逊股东起诉公司和贝索斯,称其在购买卫星发射服务时忽视了 SpaceX

9月3日消息,亚马逊的一些股东,包括持有该公司股票的一家养老基金,日前对亚马逊、其创始人贝索斯和其董事会提起诉讼,指控他们在为 Project Kuiper 卫星星座项目购买发射服务时“违反了信义义务”。

发布于:1年以前  |  444次阅读  |  详细内容 »

苹果上线AppsbyApple网站,以推广自家应用程序

据消息,为推广自家应用,苹果现推出了一个名为“Apps by Apple”的网站,展示了苹果为旗下产品(如 iPhone、iPad、Apple Watch、Mac 和 Apple TV)开发的各种应用程序。

发布于:1年以前  |  442次阅读  |  详细内容 »

特斯拉美国降价引发投资者不满:“这是短期麻醉剂”

特斯拉本周在美国大幅下调Model S和X售价,引发了该公司一些最坚定支持者的不满。知名特斯拉多头、未来基金(Future Fund)管理合伙人加里·布莱克发帖称,降价是一种“短期麻醉剂”,会让潜在客户等待进一步降价。

发布于:1年以前  |  441次阅读  |  详细内容 »

光刻机巨头阿斯麦:拿到许可,继续对华出口

据外媒9月2日报道,荷兰半导体设备制造商阿斯麦称,尽管荷兰政府颁布的半导体设备出口管制新规9月正式生效,但该公司已获得在2023年底以前向中国运送受限制芯片制造机器的许可。

发布于:1年以前  |  437次阅读  |  详细内容 »

马斯克与库克首次隔空合作:为苹果提供卫星服务

近日,根据美国证券交易委员会的文件显示,苹果卫星服务提供商 Globalstar 近期向马斯克旗下的 SpaceX 支付 6400 万美元(约 4.65 亿元人民币)。用于在 2023-2025 年期间,发射卫星,进一步扩展苹果 iPhone 系列的 SOS 卫星服务。

发布于:1年以前  |  430次阅读  |  详细内容 »

𝕏(推特)调整隐私政策,可拿用户发布的信息训练 AI 模型

据报道,马斯克旗下社交平台𝕏(推特)日前调整了隐私政策,允许 𝕏 使用用户发布的信息来训练其人工智能(AI)模型。新的隐私政策将于 9 月 29 日生效。新政策规定,𝕏可能会使用所收集到的平台信息和公开可用的信息,来帮助训练 𝕏 的机器学习或人工智能模型。

发布于:1年以前  |  428次阅读  |  详细内容 »

荣耀CEO谈华为手机回归:替老同事们高兴,对行业也是好事

9月2日,荣耀CEO赵明在采访中谈及华为手机回归时表示,替老同事们高兴,觉得手机行业,由于华为的回归,让竞争充满了更多的可能性和更多的魅力,对行业来说也是件好事。

发布于:1年以前  |  423次阅读  |  详细内容 »

AI操控无人机能力超越人类冠军

《自然》30日发表的一篇论文报道了一个名为Swift的人工智能(AI)系统,该系统驾驶无人机的能力可在真实世界中一对一冠军赛里战胜人类对手。

发布于:1年以前  |  423次阅读  |  详细内容 »

AI生成的蘑菇科普书存在可致命错误

近日,非营利组织纽约真菌学会(NYMS)发出警告,表示亚马逊为代表的电商平台上,充斥着各种AI生成的蘑菇觅食科普书籍,其中存在诸多错误。

发布于:1年以前  |  420次阅读  |  详细内容 »

社交媒体平台𝕏计划收集用户生物识别数据与工作教育经历

社交媒体平台𝕏(原推特)新隐私政策提到:“在您同意的情况下,我们可能出于安全、安保和身份识别目的收集和使用您的生物识别信息。”

发布于:1年以前  |  411次阅读  |  详细内容 »

国产扫地机器人热销欧洲,国产割草机器人抢占欧洲草坪

2023年德国柏林消费电子展上,各大企业都带来了最新的理念和产品,而高端化、本土化的中国产品正在不断吸引欧洲等国际市场的目光。

发布于:1年以前  |  406次阅读  |  详细内容 »

罗永浩吐槽iPhone15和14不会有区别,除了序列号变了

罗永浩日前在直播中吐槽苹果即将推出的 iPhone 新品,具体内容为:“以我对我‘子公司’的了解,我认为 iPhone 15 跟 iPhone 14 不会有什么区别的,除了序(列)号变了,这个‘不要脸’的东西,这个‘臭厨子’。

发布于:1年以前  |  398次阅读  |  详细内容 »
 目录