Result of FASTA (ccds) for pFN21AE4192
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KE4192, 693 aa
  1>>>pF1KE4192 693 - 693 aa - 693 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 6.4339+/-0.00112; mu= 13.3048+/- 0.067
 mean_var=65.6751+/-13.441, 0's: 0 Z-trim(101.0): 29  B-trim: 0 in 0/49
 Lambda= 0.158261
 statistics sampled from 6342 (6356) to 6342 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.54), E-opt: 0.2 (0.195), width:  16
 Scan time:  3.360

The best scores are:                                      opt bits E(32554)
CCDS34355.1 ZBED9 gene_id:114821|Hs108|chr6        (1325) 1457 342.1 3.2e-93
CCDS387.2 ZMYM6 gene_id:9204|Hs108|chr1            (1325) 1257 296.4 1.8e-79
CCDS34283.1 ZBED8 gene_id:63920|Hs108|chr5         ( 594) 1203 284.1   4e-76
CCDS47028.1 FAM200B gene_id:285550|Hs108|chr4      ( 657)  952 226.8   8e-59
CCDS5668.1 FAM200A gene_id:221786|Hs108|chr7       ( 573)  872 208.5 2.2e-53
CCDS5576.1 GTF2IRD2 gene_id:84163|Hs108|chr7       ( 949)  549 134.8 5.8e-31
CCDS34659.1 GTF2IRD2B gene_id:389524|Hs108|chr7    ( 949)  545 133.8 1.1e-30
CCDS46790.1 EPM2AIP1 gene_id:9852|Hs108|chr3       ( 607)  434 108.5   3e-23


>>CCDS34355.1 ZBED9 gene_id:114821|Hs108|chr6             (1325 aa)
 initn: 1231 init1: 468 opt: 1457  Z-score: 1787.1  bits: 342.1 E(32554): 3.2e-93
Smith-Waterman score: 1457; 37.5% identity (69.6% similar) in 645 aa overlap (64-693:683-1325)

            40        50        60        70        80           90
pF1KE4 LPMDLLLKQGSLKQEVESFCYQIVSESNDQKVGILQSEDKQLQPSVSKK---SEGELSRV
                                     :::  .... .:.  :.:.   ::   :  
CCDS34 MKRKHDEIQRSLPVKPSKMLKPSGTPFSPDKVGDWMAKQASLDFFVKKRHAFSEHSSSNK
            660       670       680       690       700       710  

              100            110       120       130       140     
pF1KE4 KFISNSNKITFSKKPK-----RRKYDESYLSFGFTYFGNRDAPHAQCVLCKKILSNSSLA
       . ..: .    .:  .      :::: ::. :::.   . .. . ::..:  .:.: .. 
CCDS34 RNVNNRSYPEEGKTKRVHASFTRKYDPSYIEFGFVAVIDGEVLKPQCIICGDVLANEAMK
            720       730       740       750       760       770  

         150       160       170       180       190       200     
pF1KE4 PSKLRRHLETKHAAYKDKDISFFKQHLDSPENNKPPTPKIVNTDNESATEASYNVSYHIA
       ::::.::: .::   ...   ::... .:  ...:     :.  : :: .:::.:.  .:
CCDS34 PSKLKRHLYSKHKEISSQPKEFFERK-SSELKSQPKQVFNVSHINISALRASYKVALPVA
            780       790        800       810       820       830 

         210       220       230       240       250       260     
pF1KE4 LSGEAHTIGELLIKPCAKDVVMRMFDEQYSKKIDAVQLSNSTVARRIKDLAADIEEELVC
        :   .::.: :.: : :.: ..:. :. .::.  : :::.:.::::..:: :.:..:. 
CCDS34 KSKTPYTIAETLVKDCIKEVCLEMLGESAAKKVAQVPLSNDTIARRIQELANDMEDQLIE
             840       850       860       870       880       890 

         270       280       290       300       310       320     
pF1KE4 RLKICDGFSLQLDESADVSGLAVLLVFVRYRFNKSIEEDLLLCESLQSNATGEEIFNCIN
       ..:.   :::::::  :.... .:::.::.. . .:.:....  :: .:.:. :... ..
CCDS34 QIKLAKYFSLQLDECRDIANMIILLVYVRFEHDDDIKEEFFFSASLPTNTTSSELYEAVK
             900       910       920       930       940       950 

          330       340       350       360       370       380    
pF1KE4 SFM-QKHEIEWEKCVDVCSDASRAVDGKIAEAVTLIKYVAPESTSSHCLLYRHALAVKIM
       ... .:  .:.. :: ::::.. .. :: .:.:: :: .:::  ..::...:..::.: .
CCDS34 NYIVNKCGLEFKFCVGVCSDGAASMTGKHSEVVTQIKELAPECKTTHCFIHRESLAMKKI
             960       970       980       990      1000      1010 

          390       400       410       420       430       440    
pF1KE4 PTSLKNVLDQAVQIINYIKARPHQSRLLKILCEEMGAQHTALLLNTEVRWLSRGKVLVRL
        . :..::.. :.:.::::.   .:::...::..: :.:  :::..:.::::::::: :.
CCDS34 SAELNSVLNDIVKIVNYIKSNSLNSRLFSLLCDNMEADHKQLLLHAEIRWLSRGKVLSRM
            1020      1030      1040      1050      1060      1070 

          450       460        470       480       490       500   
pF1KE4 FELRRELLVFMDSAFRL-SDCLTNSSWLLRLAYLADIFTKLNEVNLSMQGKNVTVFTVFD
       ::.: :::::...   . :. . . .:  :::::.:::. .:..: ::::::.: :.. :
CCDS34 FEIRNELLVFLQGKKPMWSQLFKDVNWTARLAYLSDIFSIFNDLNASMQGKNATYFSMAD
            1080      1090      1100      1110      1120      1130 

           510       520       530       540        550       560  
pF1KE4 KMSSLLRKLEFWASSVEEENFDCFPTLSDFLTEINSTVD-KDICSAIVQHLRGLRATLLK
       :. .  .::: : . .  . .: : .:. ...:... .:   . ..: .:: .:   .  
CCDS34 KVEGQKQKLEAWKNRISTDCYDMFHNLTTIINEVGNDLDIAHLRKVISEHLTNLLECFEF
            1140      1150      1160      1170      1180      1190 

               570       580       590       600       610         
pF1KE4 YFPVTND---NNAWVRNPFTVTVKPASLVARDYESLIDLTSDSQVKQNFSEL-SLNDFWS
       :::  .:   .: :..:::  .    .:..   ..:. :..:  .: .: .  :: .:: 
CCDS34 YFPSKEDPRIGNLWIQNPFLSSKDNLNLTVTLQDKLLKLATDEGLKISFENTASLPSFWI
            1200      1210      1220      1230      1240      1250 

      620       630       640       650       660       670        
pF1KE4 SLIQEYPSIARRAVRVLLPFATMHLCETGFSYYAATKTKYRKRLDAAPHMRIRLSNITPN
       .  ..:: .:. :...:: : . .:::::::  .. :::.:. :.    .:. ::.: : 
CCDS34 KAKNDYPELAEIALKLLLLFPSTYLCETGFSTLSVIKTKHRNSLNIHYPLRVALSSIQPR
            1260      1270      1280      1290      1300      1310 

      680       690   
pF1KE4 IKRICDKKTQKHCSH
       . .. .:: : : ::
CCDS34 LDKLTSKK-QAHLSH
             1320     

>>CCDS387.2 ZMYM6 gene_id:9204|Hs108|chr1                 (1325 aa)
 initn: 1092 init1: 291 opt: 1257  Z-score: 1540.3  bits: 296.4 E(32554): 1.8e-79
Smith-Waterman score: 1260; 32.2% identity (70.6% similar) in 636 aa overlap (67-686:696-1324)

         40        50        60        70        80        90      
pF1KE4 DLLLKQGSLKQEVESFCYQIVSESNDQKVGILQSEDKQLQPSVSKKSEGELSRVKFISNS
                                     . :..  . .: ...: : . . . . ...
CCDS38 STQEDAMKFPSSQSSQPSRLLKNKGISCKPVTQTKATSCKPHTQHK-ECQ-TDLPMPNEK
         670       680       690       700       710         720   

        100              110       120         130       140       
pF1KE4 NKITFSKKPKRRK-------YDESYLSFGFTYF-GNRDA-PHAQCVLCKKILSNSSLAPS
       :   ... :...:       ::  ::. ::    :.... :. :::.: .:::. .. :.
CCDS38 NDAELDSPPSKKKRLGFFQTYDTEYLKVGFIICPGSKESSPRPQCVICGEILSSENMKPA
           730       740       750       760       770       780   

       150       160       170       180       190       200       
pF1KE4 KLRRHLETKHAAYKDKDISFFKQHLDSPENNKPPTPKIVNTDNESATEASYNVSYHIALS
       .: .::.:::.  ..: ..::.:.    : ..    : . .. .: ..::: .... : :
CCDS38 NLSHHLKTKHSELENKPVDFFEQKSLEMECQNSSLKKCLLVE-KSLVKASYLIAFQTAAS
           790       800       810       820        830       840  

       210       220       230       240       250       260       
pF1KE4 GEAHTIGELLIKPCAKDVVMRMFDEQYSKKIDAVQLSNSTVARRIKDLAADIEEELVCRL
        .  .:.: ::::   ..  ...  . . :. .. ::: :. .:: .:.::::..:. ..
CCDS38 KKPFSIAEELIKPYLVEMCSEVLGSSAGDKMKTIPLSNVTIQHRIDELSADIEDQLIQKV
            850       860       870       880       890       900  

       270       280       290         300       310       320     
pF1KE4 KICDGFSLQLDESADVSGLAVLLVFVRY-RFN-KSIEEDLLLCESLQSNATGEEIFNCIN
       .    :.::.:::...:....:: ..:.  .. ....:.::.:  . .. :: :::. ::
CCDS38 RESKWFALQIDESSEISNITLLLCYIRFIDYDCRDVKEELLFCIEMPTQITGFEIFELIN
            910       920       930       940       950       960  

         330       340       350       360        370       380    
pF1KE4 SFMQKHEIEWEKCVDVCSDASRAVDGKIAEAVTLIKYVAPESTS-SHCLLYRHALAVKIM
       ...... ..:..:: .:.:.. .. :. .   . :. :: .... .::...:. :... .
CCDS38 KYIDSKSLNWKHCVGLCTDGAASMTGRYSGLKAKIQEVAMNTAAFTHCFIHRERLVAEKL
            970       980       990      1000      1010      1020  

          390       400       410       420       430       440    
pF1KE4 PTSLKNVLDQAVQIINYIKARPHQSRLLKILCEEMGAQHTALLLNTEVRWLSRGKVLVRL
          :...: :..::...::.   .::.: :::::::..:..: :..::::.:::..: ::
CCDS38 SPCLHKILLQSAQILSFIKSNALNSRMLTILCEEMGSEHVSLPLHAEVRWISRGRMLKRL
           1030      1040      1050      1060      1070      1080  

          450       460        470       480       490       500   
pF1KE4 FELRRELLVFMDSAFR-LSDCLTNSSWLLRLAYLADIFTKLNEVNLSMQGKNVTVFTVFD
       ::::.:. .:...    :.  . .  :. .::::.:::. .::.:::.::  .: :.. .
CCDS38 FELRHEIEIFLSQKHSDLAKYFHDEEWVGKLAYLSDIFSLINELNLSLQGTLTTFFNLCN
           1090      1100      1110      1120      1130      1140  

           510       520       530       540       550       560   
pF1KE4 KMSSLLRKLEFWASSVEEENFDCFPTLSDFLTEINSTVDKDICSAIVQHLRGLRATLLKY
       :.. . :::..: . ..:...: ::..:.: .. ..    ::   : .::.::  ..   
CCDS38 KIDVFKRKLKMWLKRTQENDYDMFPSFSEF-SNSSGLNMTDITRIIFEHLEGLSQVFSDC
           1150      1160      1170       1180      1190      1200 

              570       580       590       600       610       620
pF1KE4 FPVTND---NNAWVRNPFTVTVKPASLVARDYESLIDLTSDSQVKQNFSELSLNDFWSSL
       ::  .:   .: :. .:: .. .  .:.  . :.: .:.::  ..  :. .:...:: . 
CCDS38 FPPEQDLRSGNLWIIHPF-MNHQNNNLTDFEEEKLTELSSDLGLQALFKSVSVTQFWINA
            1210       1220      1230      1240      1250      1260

              630       640       650       660       670       680
pF1KE4 IQEYPSIARRAVRVLLPFATMHLCETGFSYYAATKTKYRKRLDAAPHMRIRLSNITPNIK
          :: . .::.. ::::.:..::...::  : :..: .. : ..: .:. .... : :.
CCDS38 KTSYPELHERAMKFLLPFSTVYLCDAAFS--ALTESKQKNLLGSGPALRLAVTSLIPRIE
             1270      1280        1290      1300      1310        

              690   
pF1KE4 RICDKKTQKHCSH
       ..  .:       
CCDS38 KLVKEKE      
     1320           

>>CCDS34283.1 ZBED8 gene_id:63920|Hs108|chr5              (594 aa)
 initn: 1075 init1: 473 opt: 1203  Z-score: 1480.1  bits: 284.1 E(32554): 4e-76
Smith-Waterman score: 1203; 32.9% identity (68.9% similar) in 592 aa overlap (106-688:3-588)

          80        90       100       110       120        130    
pF1KE4 QPSVSKKSEGELSRVKFISNSNKITFSKKPKRRKYDESYLSFGFTYFGNRDAPH-AQCVL
                                     :.::.:..:. . ::   . :. .  ::::
CCDS34                             MSKKRKWDDDYVRYWFTCTTEVDGTQRPQCVL
                                           10        20        30  

          140       150       160       170       180        190   
pF1KE4 CKKILSNSSLAPSKLRRHLETKHAAYKDKDISFFKQHLDSPENNKPPTPKI-VNTDNESA
       :....::..: ::::  :.. .:..   .:.. .: :. .: ...     . : . ... 
CCDS34 CNSVFSNADLRPSKLSDHFNRQHGGVAGHDLNSLK-HMPAPSDQSETLKAFGVASHEDTL
             40        50        60         70        80        90 

           200       210       220       230       240       250   
pF1KE4 TEASYNVSYHIALSGEAHTIGELLIKPCAKDVVMRMFDEQYSKKIDAVQLSNSTVARRIK
        .:::. .:  :   . ::..: :.:::: .... ..  . .::.. : ::....  :: 
CCDS34 LQASYQFAYLCAKEKNPHTVAEKLVKPCALEIAQIVLGPDAQKKLQQVPLSDDVIHSRID
             100       110       120       130       140       150 

           260       270        280       290       300       310  
pF1KE4 DLAADIEEELVCRLKICD-GFSLQLDESADVSGLAVLLVFVRYRFNKSIEEDLLLCESLQ
       ... :: ....  .:      ..:: :..:..  . :..::::  .. : :..:.:: ::
CCDS34 EMSQDILQQVLEDIKASPLKVGIQLAETTDMDDCSQLMAFVRYIKEREIVEEFLFCEPLQ
             160       170       180       190       200       210 

            320       330       340       350       360       370  
pF1KE4 SNATGEEIFNCINSFMQKHEIEWEKCVDVCSDASRAVDGKIAEAVTLIKYVAPESTSSHC
        .  : ..:: . .:. ::.:  . : .::.:.. .. :. .: :. .:   :. . .::
CCDS34 LSMKGIDVFNLFRDFFLKHKIALDVCGSVCTDGASSMLGENSEFVAYVKKEIPHIVVTHC
             220       230       240       250       260       270 

            380       390       400       410       420       430  
pF1KE4 LLYRHALAVKIMPTSLKNVLDQAVQIINYIKARPHQSRLLKILCEEMGAQHTALLLNTEV
       ::  :::..: .::.:...:  .:..::.::.:  . ::.. . ::.: ....::..::.
CCDS34 LLNPHALVIKTLPTKLRDALFTVVRVINFIKGRAPNHRLFQAFFEEIGIEYSVLLFHTEM
             280       290       300       310       320       330 

            440       450        460       470       480       490 
pF1KE4 RWLSRGKVLVRLFELRRELLVFMD-SAFRLSDCLTNSSWLLRLAYLADIFTKLNEVNLSM
       ::::::..:...::. .:.  :.  ..  : : . :. . ..::::::.: .:::.. ::
CCDS34 RWLSRGQILTHIFEMYEEINQFLHHKSSNLVDGFENKEFKIHLAYLADLFKHLNELSASM
             340       350       360       370       380       390 

             500       510       520       530       540       550 
pF1KE4 QGKNVTVFTVFDKMSSLLRKLEFWASSVEEENFDCFPTLSDFLTEINSTVDKDICSAIVQ
       :  .... .. .:.:...::. :: . .:..::  :: : ....  :  .   : . :. 
CCDS34 QRTGMNTVSAREKLSAFVRKFPFWQKRIEKRNFTNFPFLEEIIVSDNEGIF--IAAEITL
             400       410       420       430       440           

             560       570         580       590          600      
pF1KE4 HLRGLRATLLKYFPVTNDNNA--WVRNPFTVTVKPASLVARDY---ESLIDLTSDSQVKQ
       ::. :   .  :: . . :.:  :. .::  ..   ..:  .:   ..: .: ...:. .
CCDS34 HLQQLSNFFHGYFSIGDLNEASKWILDPFLFNI---DFVDDSYLMKNDLAELRASGQILM
     450       460       470       480          490       500      

        610       620       630       640       650       660      
pF1KE4 NFSELSLNDFWSSLIQEYPSIARRAVRVLLPFATMHLCETGFSYYAATKTKYRKRLDAAP
       .:  ..:.::: . .  .:..:. :...:.:::: .::: :::     ::: :. .. . 
CCDS34 EFETMKLEDFWCAQFTAFPNLAKTALEILMPFATTYLCELGFSSLLHFKTKSRSCFNLSD
        510       520       530       540       550       560      

        670       680       690    
pF1KE4 HMRIRLSNITPNIKRICDKKTQKHCSH 
        .:. .:. .: .. : ..: :      
CCDS34 DIRVAISKKVPRFSDIIEQKLQLQQKSL
        570       580       590    

>>CCDS47028.1 FAM200B gene_id:285550|Hs108|chr4           (657 aa)
 initn: 747 init1: 286 opt: 952  Z-score: 1169.5  bits: 226.8 E(32554): 8e-59
Smith-Waterman score: 1204; 32.9% identity (67.4% similar) in 675 aa overlap (36-688:1-655)

          10        20        30        40        50        60     
pF1KE4 LCILSYNFNTFAILNVYSKLTMFCTTNSLPMDLLLKQGSLKQEVESFCYQIVSESNDQKV
                                     :: .. . . ..::.   :  .  :.. . 
CCDS47                               MDHFFIKRKRNSEVK---YTEACSSSSVES
                                             10           20       

          70        80        90       100        110       120    
pF1KE4 GILQSEDKQLQPSVSKKSEGELSRVKFISNSNKITFSKKP-KRRKYDESYLSFGFTY---
       ::..:..      . :.....:.     :.: .  :.::  . :.:.:.::..::     
CCDS47 GIVNSDN------IEKNTDSNLQT----STSFEPHFKKKKVSARRYNEDYLKYGFIKCEK
        30              40            50        60        70       

              130       140       150       160       170       180
pF1KE4 -FGNRDAPHAQCVLCKKILSNSSLAPSKLRRHLETKHAAYKDKDISFFKQHLDSPENNKP
        : : : :  :::.:..::.: :: ::::.:::::.::   :: . .:...    .. : 
CCDS47 PFEN-DRP--QCVICNNILANESLKPSKLKRHLETQHAELIDKPLEYFQRK---KKDIKL
        80           90       100       110       120          130 

                190       200       210       220       230        
pF1KE4 PTPKIVNTD--NESATEASYNVSYHIALSGEAHTIGELLIKPCAKDVVMRMFDEQYSKKI
        :  .  .   .:.:  .:: :.:..:    :.: .: .: :   :.:  .::.. . :.
CCDS47 STQFLSCSTAVSEKALLSSYLVAYRVAKEKIANTAAEKIILPACLDMVRTIFDDKSADKL
             140       150       160       170       180       190 

      240       250       260       270       280       290        
pF1KE4 DAVQLSNSTVARRIKDLAADIEEELVCRLKICDGFSLQLDESADVSGLAVLLVFVRYRFN
        ..  ...::. ::  .:  .:  :. ::.    :..:::::.:... ..:::.::: ..
CCDS47 KTIP-NDNTVSLRICTIAEHLETMLITRLQSGIDFAIQLDESTDIGSCTTLLVYVRYAWQ
              200       210       220       230       240       250

      300       310       320        330       340       350       
pF1KE4 KSIEEDLLLCESLQSNATGEEIFNCINS-FMQKHEIEWEKCVDVCSDASRAVDGKIAEAV
        .. ::.:   .: :. .: .::. ..  .. .....:..:  . ::.. .. :: ....
CCDS47 DDFLEDFLCFLNLTSHLSGLDIFTELERRIVGQYKLNWKNCKGITSDGTATMTGKHSRVI
              260       270       280       290       300       310

        360       370       380       390       400       410      
pF1KE4 T-LIKYVAPESTSSHCLLYRHALAVKIMPTSLKNVLDQAVQIINYIKARPHQSRLLKILC
         :.. .   .. .::...:..:: . .: .: .:: .::...:.::.   .::::. .:
CCDS47 KKLLEVTNNGAVWNHCFIHREGLASREIPQNLMEVLKNAVKVVNFIKGSSLNSRLLETFC
              320       330       340       350       360       370

        420       430       440       450        460       470     
pF1KE4 EEMGAQHTALLLNTEVRWLSRGKVLVRLFELRRELLVFM-DSAFRLSDCLTNSSWLLRLA
        :.:..:: :: .:..::::.::.: :..::: :.  :. ..  .:.. . ...:. .::
CCDS47 SEIGTNHTHLLYHTKIRWLSQGKILSRVYELRNEIHFFLIEKKSHLASIFEDDTWVTKLA
              380       390       400       410       420       430

         480       490       500       510       520         530   
pF1KE4 YLADIFTKLNEVNLSMQGKNVTVFTVFDKMSSLLRKLEFWASSVEEE--NFDCFPTLSDF
       ::.:::. :::..:..::::  ::   ...... . : .:   .. .  ..  :: . . 
CCDS47 YLTDIFSILNELSLKLQGKNSDVFQHVERIQGFRKTLLLWQVRLKSNRPSYYMFPRFLQH
              440       450       460       470       480       490

             540       550       560           570       580       
pF1KE4 LTE--INSTVDKDICSAIVQHLRGLRATLLKYFPV----TNDNNAWVRNPFTV----TVK
       . :  :: .. :.:   :. :: .:  :. ..::     :  .:.::..::.     .. 
CCDS47 IEENIINENILKEIKLEILLHLTSLSQTFNHFFPEEKFETLRENSWVKDPFAFRHPESII
              500       510       520       530       540       550

           590       600       610       620       630       640   
pF1KE4 PASLVARDYESLIDLTSDSQVKQNFSELSLNDFWSSLIQEYPSIARRAVRVLLPFATMHL
         .:: .. . :..:.:.  .:...  :::. :: .. ...: ..:..: .::::.:  :
CCDS47 ELNLVPEEENELLQLSSSYTLKNDYETLSLSAFWMKVKEDFPLLSRKSVLLLLPFTTTSL
              560       570       580       590       600       610

           650       660       670       680       690   
pF1KE4 CETGFSYYAATKTKYRKRLDAAPHMRIRLSNITPNIKRICDKKTQKHCSH
       :: :::  .  ::: :. :. :  ::. ::. .:. ... .....     
CCDS47 CELGFSILTQLKTKERNGLNCAAVMRVALSSCVPDWNELMNRQAHPS   
              620       630       640       650          

>>CCDS5668.1 FAM200A gene_id:221786|Hs108|chr7            (573 aa)
 initn: 986 init1: 321 opt: 872  Z-score: 1071.9  bits: 208.5 E(32554): 2.2e-53
Smith-Waterman score: 1146; 35.7% identity (68.9% similar) in 544 aa overlap (169-693:33-573)

      140       150       160       170       180          190     
pF1KE4 LSNSSLAPSKLRRHLETKHAAYKDKDISFFKQHLDSPENNKPPTPKIVN---TDNESATE
                                     ..:... .:.   .:....   : :: :  
CCDS56 PESRDTTDLSPGGTQEMEGIVIVKVEEEDEEDHFQKERNKVESSPQVLSRSTTMNERALL
             10        20        30        40        50        60  

         200       210       220       230       240       250     
pF1KE4 ASYNVSYHIALSGEAHTIGELLIKPCAKDVVMRMFDEQYSKKIDAVQLSNSTVARRIKDL
       .:: :.:..:    ::: .: .: :   :.:  .::.. . :. .. ::..:..:::  .
CCDS56 SSYLVAYRVAKEKMAHTAAEKIILPACMDMVRTIFDDKSADKLRTIPLSDNTISRRICTI
             70        80        90       100       110       120  

         260       270       280       290       300       310     
pF1KE4 AADIEEELVCRLKICDGFSLQLDESADVSGLAVLLVFVRYRFNKSIEEDLLLCESLQSNA
       :  .:  :. ::.    :..:::::.:...  .:::.::: .. .. :::: : .:.:. 
CCDS56 AKHLEAMLITRLQSGIDFAIQLDESTDIASCPTLLVYVRYVWQDDFVEDLLCCLNLNSHI
            130       140       150       160       170       180  

         320        330       340       350        360       370   
pF1KE4 TGEEIFNCI-NSFMQKHEIEWEKCVDVCSDASRAVDGKIAEAVT-LIKYVAPESTSSHCL
       :: ..:. . : .. .....:..:  . ::..  . :: .. .  :.. .  ... .::.
CCDS56 TGLDLFTELENCLLGQYKLNWKHCKGISSDGTANMTGKHSRLTEKLLEATHNNAVWNHCF
            190       200       210       220       230       240  

           380       390       400       410       420       430   
pF1KE4 LYRHALAVKIMPTSLKNVLDQAVQIINYIKARPHQSRLLKILCEEMGAQHTALLLNTEVR
       ..:.::. : .  :: .:: .::. .:.::.   .::::.:.: :.:..:: ::..::::
CCDS56 IHREALVSKEISPSLMDVLKNAVKTVNFIKGSSLNSRLLEIFCSEIGVNHTHLLFHTEVR
            250       260       270       280       290       300  

           440       450        460       470       480       490  
pF1KE4 WLSRGKVLVRLFELRRELLVFM-DSAFRLSDCLTNSSWLLRLAYLADIFTKLNEVNLSMQ
       :::.:::: :..::: :. .:. ..  .:.. . .. :. .::::.:::  :::..:.::
CCDS56 WLSQGKVLSRVYELRNEIYIFLVEKQSHLANIFEDDIWVTKLAYLSDIFGILNELSLKMQ
            310       320       330       340       350       360  

            500       510       520         530         540        
pF1KE4 GKNVTVFTVFDKMSSLLRKLEFWASSVEEE--NFDCFPTLSDFLTE--INSTVDKDICSA
       :::  .:  .... .. . : .: . .. .  ..  :::: . . :  ::    :.:   
CCDS56 GKNNDIFQYLEHILGFQKTLLLWQARLKSNRPSYYMFPTLLQHIEENIINEDCLKEIKLE
            370       380       390       400       410       420  

      550       560           570       580       590              
pF1KE4 IVQHLRGLRATLLKYFPVTN----DNNAWVRNPFTVTVKPASLVARDYES-----LIDLT
       :. :: .:  :.  :::  .     .: :...::.   .: :..  . :      :..:.
CCDS56 ILLHLTSLSQTFNYYFPEEKFESLKENIWMKDPFAFQ-NPESIIELNLEPEEENELLQLS
            430       440       450        460       470       480 

     600       610       620       630       640       650         
pF1KE4 SDSQVKQNFSELSLNDFWSSLIQEYPSIARRAVRVLLPFATMHLCETGFSYYAATKTKYR
       :.  .:. .. :::. :: .. ...: ..:... .::::.: .::: :::  .  ::: :
CCDS56 SSFTLKNYYKILSLSAFWIKIKDDFPLLSRKSILLLLPFTTTYLCELGFSILTRLKTKKR
             490       500       510       520       530       540 

     660       670       680       690   
pF1KE4 KRLDAAPHMRIRLSNITPNIKRICDKKTQKHCSH
       .::..:: ::. ::. .:. :.. ..  : : ::
CCDS56 NRLNSAPDMRVALSSCVPDWKELMNR--QAHPSH
             550       560         570   

>>CCDS5576.1 GTF2IRD2 gene_id:84163|Hs108|chr7            (949 aa)
 initn: 378 init1: 268 opt: 549  Z-score: 669.3  bits: 134.8 E(32554): 5.8e-31
Smith-Waterman score: 549; 27.1% identity (62.1% similar) in 420 aa overlap (252-662:526-936)

             230       240       250       260       270       280 
pF1KE4 AKDVVMRMFDEQYSKKIDAVQLSNSTVARRIKDLAADIEEELVCRLKICDGFSLQLDESA
                                     ..:::... :.:  ...   ..:. .:: .
CCDS55 YLLGSSDTECPEQKQVFANPSPTQKSPVQPVEDLAGNLWEKLREKIRSFVAYSIAIDEIT
         500       510       520       530       540       550     

             290        300       310       320       330       340
pF1KE4 DVSGLAVLLVFVR-YRFNKSIEEDLLLCESLQSNATGEEIFNCINSFMQKHEIEWEKCVD
       :... . : .:.:    : .. :.::    . .. .:.:::. ... ...  :.: : :.
CCDS55 DINNTTQLAIFIRGVDENFDVSEELLDTVPMTGTKSGNEIFSRVEKSLKNFCIDWSKLVS
         560       570       580       590       600       610     

               350       360            370       380       390    
pF1KE4 VCSDASRA-VDGKIAEAVTLIKYVAP-----ESTSSHCLLYRHALAVKIMPTSLKNVLDQ
       : : .. : ::.. . .. : . ::      :  :  :... ..: .. .  .. .:.: 
CCDS55 VASTGTPAMVDANNGLVTKLKSRVATFCKGAELKSICCIIHPESLCAQKL--KMDHVMDV
         620       630       640       650       660         670   

          400       410       420       430       440       450    
pF1KE4 AVQIINYIKARPHQSRLLKILCEEMGAQHTALLLNTEVRWLSRGKVLVRLFELRRELLVF
       .:. .:.: .:  .   .  :  :. .:. .::  ::..::::: :: :.::  .:.  :
CCDS55 VVKSVNWICSRGLNHSEFTTLLYELDSQYGSLLYYTEIKWLSRGLVLKRFFESLEEIDSF
           680       690       700       710       720       730   

          460       470       480       490       500       510    
pF1KE4 MDSAFRLSDCLTNSSWLLRLAYLADIFTKLNEVNLSMQGKNVTVFTVFDKMSSLLRKLEF
       :.:  .    :.. .:.  ::.:.:.  .:: .:.:.::..  :  ..: . ..: :: .
CCDS55 MSSRGKPLPQLSSIDWIRDLAFLVDMTMHLNALNISLQGHSQIVTQMYDLIRAFLAKLCL
           740       750       760       770       780       790   

          520       530       540         550       560       570  
pF1KE4 WASSVEEENFDCFPTLSDFLTEINSTVDKDICSAI--VQHLRGLRATLLKYFPVTNDNNA
       : . . ..:.  ::::     .. :  ..:  . :  . .:.      :. : . ... .
CCDS55 WETHLTRNNLAHFPTL-----KLASRNESDGLNYIPKIAELQTEFQKRLSDFKLYESELT
           800            810       820       830       840        

            580       590       600       610       620       630  
pF1KE4 WVRNPFTVTVKPASLVARDYESLIDLTSDSQVKQNFSELSLNDFWSSLIQEYPSIARRAV
          .::.. .   :.  .    .:::  .. .: ....... .:.. :   ::.  .. .
CCDS55 LFSSPFSTKID--SVHEELQMEVIDLQCNTVLKTKYDKVGIPEFYKYLWGSYPKYKHHCA
      850         860       870       880       890       900      

            640       650       660       670       680       690  
pF1KE4 RVLLPFATMHLCETGFSYYAATKTKYRKRLDAAPHMRIRLSNITPNIKRICDKKTQKHCS
       ..:  :.. ..::  :: .  .:::: ..:                              
CCDS55 KILSMFGSTYICEQLFSIMKLSKTKYCSQLKDSQWDSVLHIAT                 
        910       920       930       940                          

>>CCDS34659.1 GTF2IRD2B gene_id:389524|Hs108|chr7         (949 aa)
 initn: 378 init1: 268 opt: 545  Z-score: 664.4  bits: 133.8 E(32554): 1.1e-30
Smith-Waterman score: 545; 27.3% identity (62.0% similar) in 418 aa overlap (252-662:526-936)

             230       240       250       260       270       280 
pF1KE4 AKDVVMRMFDEQYSKKIDAVQLSNSTVARRIKDLAADIEEELVCRLKICDGFSLQLDESA
                                     ..:::... :.:  ...   ..:. .:: .
CCDS34 YLLGSSDTECPEQKQVFANPSPTQKSPVQPVEDLAGNLWEKLREKIRSFVAYSIAIDEIT
         500       510       520       530       540       550     

             290        300       310       320       330       340
pF1KE4 DVSGLAVLLVFVR-YRFNKSIEEDLLLCESLQSNATGEEIFNCINSFMQKHEIEWEKCVD
       :... . : .:.:    : .. :.::    . .. .:.:::  ... ..:  :.: . :.
CCDS34 DINNTTQLAIFIRGVDENFDVSEELLDTVPMTGTKSGNEIFLRVEKSLKKFCINWSRLVS
         560       570       580       590       600       610     

               350       360            370       380       390    
pF1KE4 VCSDASRA-VDGKIAEAVTLIKYVAP-----ESTSSHCLLYRHALAVKIMPTSLKNVLDQ
       : : .. : ::.. . .. : . ::      :  :  :... ..: .. .  .. .:.: 
CCDS34 VASTGTPAMVDANNGLVTKLKSRVATFCKGAELKSICCIIHPESLCAQKL--KMDHVMDV
         620       630       640       650       660         670   

          400       410       420       430       440       450    
pF1KE4 AVQIINYIKARPHQSRLLKILCEEMGAQHTALLLNTEVRWLSRGKVLVRLFELRRELLVF
       .:. .:.: .:  .   .  :  :. .:. .::  ::..::::: :: :.::  .:.  :
CCDS34 VVKSVNWICSRGLNHSEFTTLLYELDSQYGSLLYYTEIKWLSRGLVLKRFFESLEEIDSF
           680       690       700       710       720       730   

          460       470       480       490       500       510    
pF1KE4 MDSAFRLSDCLTNSSWLLRLAYLADIFTKLNEVNLSMQGKNVTVFTVFDKMSSLLRKLEF
       :.:  .    :.. .:.  ::.:.:.  .:: .:.:.::..  :  ..: . ..: :: .
CCDS34 MSSRGKPLPQLSSIDWIRDLAFLVDMTMHLNALNISLQGHSQIVTQMYDLIRAFLAKLCL
           740       750       760       770       780       790   

          520       530       540       550       560       570    
pF1KE4 WASSVEEENFDCFPTLSDFLTEINSTVDKDICSAIVQHLRGLRATLLKYFPVTNDNNAWV
       : . . ..:.  ::::.  :.  : .   .    :.. :.      :. : . ... .  
CCDS34 WETHLTRNNLAHFPTLK--LVSRNESDGLNYIPKIAE-LKTEFQKRLSDFKLYESELTLF
           800       810         820        830       840       850

          580       590       600       610       620       630    
pF1KE4 RNPFTVTVKPASLVARDYESLIDLTSDSQVKQNFSELSLNDFWSSLIQEYPSIARRAVRV
        .::.. .   :.  .    .:::  .. .: ....... .:.. :   ::.  .. ...
CCDS34 SSPFSTKID--SVHEELQMEVIDLQCNTVLKTKYDKVGIPEFYKYLWGSYPKYKHHCAKI
                860       870       880       890       900        

          640       650       660       670       680       690   
pF1KE4 LLPFATMHLCETGFSYYAATKTKYRKRLDAAPHMRIRLSNITPNIKRICDKKTQKHCSH
       :  :.. ..::  :: .  .:::: ..:                               
CCDS34 LSMFGSTYICEQLFSIMKLSKTKYCSQLKDSQWDSVLHIAT                  
      910       920       930       940                           

>>CCDS46790.1 EPM2AIP1 gene_id:9852|Hs108|chr3            (607 aa)
 initn: 356 init1: 195 opt: 434  Z-score: 531.0  bits: 108.5 E(32554): 3e-23
Smith-Waterman score: 434; 22.8% identity (56.3% similar) in 540 aa overlap (130-650:37-563)

     100       110       120       130       140       150         
pF1KE4 TFSKKPKRRKYDESYLSFGFTYFGNRDAPHAQCVLCKKILSNSSLAPSKLRRHLETKHAA
                                     : :..:....  .      .::: :..:  
CCDS46 RSKMEVDEALVFRPEWTQRYLVVEPPEGDGALCLVCRRLIVATR--ERDVRRHYEAEHE-
         10        20        30        40        50          60    

     160       170       180       190       200       210         
pF1KE4 YKDKDISFFKQHLDSPENNKPPTPKIVNTDNESATEASYNVSYHIALSGEAHTIGELLIK
       : .. ..  ..     .  .   :    : .: :..:. ..   .::.:..   :... .
CCDS46 YYERYVADGERAALVERLRQGDLPVASFTPEERAARAGLGLCRLLALKGRGWGEGDFVYQ
            70        80        90       100       110       120   

     220       230       240       250       260       270         
pF1KE4 PCAKDVVMRMFDEQYSKKIDAVQLSNSTVARRIKDLAADIEEELVCRLKICDGFSLQLDE
        :  .:..:    .. . ...:.:: . . .:: ..  .....:  : .   ..:: ::.
CCDS46 -CM-EVLLREVLPEHVSVLQGVDLSPDITRQRILSIDRNLRNQLFNRARDFKAYSLALDD
             130       140       150       160       170       180 

     280       290        300       310       320       330        
pF1KE4 SADVSGLAVLLVFVRYRFNK-SIEEDLLLCESLQSNATGEEIFNCINSFMQKHEIEWEKC
       .: :.    ::::.:    .  ..::::   .:  . .   ... :   .:   .  .. 
CCDS46 QAFVAYENYLLVFIRGVGPELEVQEDLLTIINLTHHFSVGALMSAILESLQTAGLSLQRM
             190       200       210       220       230       240 

      340       350       360       370          380          390  
pF1KE4 VDVCSDASRAVDGKIAEAVTLIKYVAPESTSSHC---LLYRHALAVKIMPT---SLKNVL
       : . .  .  .   :.:   :..:.  ...: .:   . :   : .... .   ......
CCDS46 VGLTTTHTLRM---IGENSGLVSYMREKAVSPNCWNVIHYSGFLHLELLSSYDVDVNQII
             250          260       270       280       290        

            400           410       420       430       440        
pF1KE4 DQAVQIINYIKAR----PHQSRLLKILCEEMGAQHTALLLNTEVRWLSRGKVLVRLFELR
       .   . :  ::.:    :. . ::     : : . ..  ::.   :: :::.:  .: ::
CCDS46 NTISEWIVLIKTRGVRRPEFQTLLTESESEHGERVNGRCLNN---WLRRGKTLKLIFSLR
      300       310       320       330       340          350     

      450       460       470       480       490       500        
pF1KE4 RELLVFMDSAFRLSDCLTNSSWLLRLAYLADIFTKLNEVNLSMQGKNVTVFTVFDKMSSL
       .:. .:. :.   .  .....::  ...:.::. .: :..  .. ..: . ..::.. ..
CCDS46 KEMEAFLVSVGATTVHFSDKQWLCDFGFLVDIMEHLRELSEELRVSKVFAAAAFDHICTF
         360       370       380       390       400       410     

      510       520       530       540              550       560 
pF1KE4 LRKLEFWASSVEEENFDCFPTLSDFLTEINST-------VDKDICSAIVQHLRGLRATLL
         ::...   .::.:.  ::.: . . :...         : :  . .. .:.      .
CCDS46 EVKLNLFQRHIEEKNLTDFPALREVVDELKQQNKEDEKIFDPDRYQMVICRLQKEFERHF
         420       430       440       450       460       470     

             570       580       590       600       610       620 
pF1KE4 KYFPVTNDNNAWVRNPFTVTVKPASLVARDYESLIDLTSDSQVKQNFSELSLNDFWSSLI
       : .   . .     :::.   . : . .:    :  : ..... ...   .:..:...: 
CCDS46 KDLRFIKKDLELFSNPFNFKPEYAPISVR--VELTKLQANTNLWNEYRIKDLGQFYAGLS
         480       490       500         510       520       530   

              630       640       650       660       670       680
pF1KE4 QE-YPSIARRAVRVLLPFATMHLCETGFSYYAATKTKYRKRLDAAPHMRIRLSNITPNIK
        : :: :   : .:   : . ..:: .:::                              
CCDS46 AESYPIIKGVACKVASLFDSNQICEKAFSYLTRNQHTLSQPLTDEHLQALFRVATTEMEP
           540       550       560       570       580       590   




693 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Sun Nov  6 04:08:22 2016 done: Sun Nov  6 04:08:23 2016
 Total Scan time:  3.360 Total Display time:  0.140

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com