FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE5792, 656 aa 1>>>pF1KE5792 656 - 656 aa - 656 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.0048+/-0.000858; mu= 16.5742+/- 0.052 mean_var=81.0285+/-15.849, 0's: 0 Z-trim(107.7): 19 B-trim: 0 in 0/51 Lambda= 0.142480 statistics sampled from 9734 (9744) to 9734 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.665), E-opt: 0.2 (0.299), width: 16 Scan time: 2.490 The best scores are: opt bits E(32554) CCDS31073.1 CHML gene_id:1122|Hs108|chr1 ( 656) 4366 907.3 0 CCDS14454.1 CHM gene_id:1121|Hs108|chrX ( 653) 3143 655.9 4.9e-188 CCDS48139.1 CHM gene_id:1121|Hs108|chrX ( 110) 566 125.8 3.1e-29 CCDS7071.1 GDI2 gene_id:2665|Hs108|chr10 ( 445) 438 99.8 8.4e-21 CCDS35452.1 GDI1 gene_id:2664|Hs108|chrX ( 447) 435 99.2 1.3e-20 >>CCDS31073.1 CHML gene_id:1122|Hs108|chr1 (656 aa) initn: 4366 init1: 4366 opt: 4366 Z-score: 4848.0 bits: 907.3 E(32554): 0 Smith-Waterman score: 4366; 100.0% identity (100.0% similar) in 656 aa overlap (1-656:1-656) 10 20 30 40 50 60 pF1KE5 MADNLPTEFDVVIIGTGLPESILAAACSRSGQRVLHIDSRSYYGGNWASFSFSGLLSWLK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 MADNLPTEFDVVIIGTGLPESILAAACSRSGQRVLHIDSRSYYGGNWASFSFSGLLSWLK 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE5 EYQQNNDIGEESTVVWQDLIHETEEAITLRKKDETIQHTEAFCYASQDMEDNVEEIGALQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 EYQQNNDIGEESTVVWQDLIHETEEAITLRKKDETIQHTEAFCYASQDMEDNVEEIGALQ 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE5 KNPSLGVSNTFTEVLDSALPEESQLSYFNSDEMPAKHTQKSDTEISLEVTDVEESVEKEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 KNPSLGVSNTFTEVLDSALPEESQLSYFNSDEMPAKHTQKSDTEISLEVTDVEESVEKEK 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE5 YCGDKTCMHTVSDKDGDKDESKSTVEDKADEPIRNRITYSQIVKEGRRFNIDLVSKLLYS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 YCGDKTCMHTVSDKDGDKDESKSTVEDKADEPIRNRITYSQIVKEGRRFNIDLVSKLLYS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE5 QGLLIDLLIKSDVSRYVEFKNVTRILAFREGKVEQVPCSRADVFNSKELTMVEKRMLMKF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 QGLLIDLLIKSDVSRYVEFKNVTRILAFREGKVEQVPCSRADVFNSKELTMVEKRMLMKF 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE5 LTFCLEYEQHPDEYQAFRQCSFSEYLKTKKLTPNLQHFVLHSIAMTSESSCTTIDGLNAT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 LTFCLEYEQHPDEYQAFRQCSFSEYLKTKKLTPNLQHFVLHSIAMTSESSCTTIDGLNAT 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE5 KNFLQCLGRFGNTPFLFPLYGQGEIPQGFCRMCAVFGGIYCLRHKVQCFVVDKESGRCKA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 KNFLQCLGRFGNTPFLFPLYGQGEIPQGFCRMCAVFGGIYCLRHKVQCFVVDKESGRCKA 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE5 IIDHFGQRINAKYFIVEDSYLSEETCSNVQYKQISRAVLITDQSILKTDLDQQTSILIVP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 IIDHFGQRINAKYFIVEDSYLSEETCSNVQYKQISRAVLITDQSILKTDLDQQTSILIVP 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE5 PAEPGACAVRVTELCSSTMTCMKDTYLVHLTCSSSKTAREDLESVVKKLFTPYTETEINE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 PAEPGACAVRVTELCSSTMTCMKDTYLVHLTCSSSKTAREDLESVVKKLFTPYTETEINE 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE5 EELTKPRLLWALYFNMRDSSGISRSSYNGLPSNVYVCSGPDCGLGNEHAVKQAETLFQEI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 EELTKPRLLWALYFNMRDSSGISRSSYNGLPSNVYVCSGPDCGLGNEHAVKQAETLFQEI 550 560 570 580 590 600 610 620 630 640 650 pF1KE5 FPTEEFCPPPPNPEDIIFDGDDKQPEAPGTNNVVMAKLESSEESKNLESPEKHLQN :::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 FPTEEFCPPPPNPEDIIFDGDDKQPEAPGTNNVVMAKLESSEESKNLESPEKHLQN 610 620 630 640 650 >>CCDS14454.1 CHM gene_id:1121|Hs108|chrX (653 aa) initn: 2894 init1: 2359 opt: 3143 Z-score: 3489.4 bits: 655.9 E(32554): 4.9e-188 Smith-Waterman score: 3143; 72.0% identity (88.8% similar) in 653 aa overlap (1-652:1-650) 10 20 30 40 50 60 pF1KE5 MADNLPTEFDVVIIGTGLPESILAAACSRSGQRVLHIDSRSYYGGNWASFSFSGLLSWLK :::.::.::::..:::::::::.::::::::.::::.::::::::::::::::::::::: CCDS14 MADTLPSEFDVIVIGTGLPESIIAAACSRSGRRVLHVDSRSYYGGNWASFSFSGLLSWLK 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE5 EYQQNNDIGEESTVVWQDLIHETEEAITLRKKDETIQHTEAFCYASQDMEDNVEEIGALQ :::.:.:: .: : ::: : :.::::.: .::.::::.:.:::::::....::: :::: CCDS14 EYQENSDIVSDSPV-WQDQILENEEAIALSRKDKTIQHVEVFCYASQDLHEDVEEAGALQ 70 80 90 100 110 130 140 150 160 170 pF1KE5 KNPSLGVSNTFTEVLDSA-LPEESQLSYFNSDEMPAKHTQKSDTEISLEVTDVEESVEKE :: .: .: . ::. ::: :: :.. : :: ...: .:: : .:::. .: . ::: CCDS14 KNHALVTSANSTEAADSAFLPTEDESLSTMSCEMLTEQTPSSDPENALEVNGAEVTGEKE 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE5 KYCGDKTCMHTVSDKDGDKDESKSTVEDKADEPIRNRITYSQIVKEGRRFNIDLVSKLLY ..: ::::. ..: .: .:. .:: ...: .::::::::.:::::::::::::::: CCDS14 NHCDDKTCVPSTSAED--MSENVPIAEDTTEQPKKNRITYSQIIKEGRRFNIDLVSKLLY 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE5 SQGLLIDLLIKSDVSRYVEFKNVTRILAFREGKVEQVPCSRADVFNSKELTMVEKRMLMK :.::::::::::.::::.::::.:::::::::.:::::::::::::::.::::::::::: CCDS14 SRGLLIDLLIKSNVSRYAEFKNITRILAFREGRVEQVPCSRADVFNSKQLTMVEKRMLMK 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE5 FLTFCLEYEQHPDEYQAFRQCSFSEYLKTKKLTPNLQHFVLHSIAMTSESSCTTIDGLNA :::::.:::..::::..... .: :::::.:::::::..:.::::::::.. .:::::.: CCDS14 FLTFCMEYEKYPDEYKGYEEITFYEYLKTQKLTPNLQYIVMHSIAMTSETASSTIDGLKA 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE5 TKNFLQCLGRFGNTPFLFPLYGQGEIPQGFCRMCAVFGGIYCLRHKVQCFVVDKESGRCK :::::.::::.::::::::::::::.:: ::::::::::::::::.:::.:::::: .:: CCDS14 TKNFLHCLGRYGNTPFLFPLYGQGELPQCFCRMCAVFGGIYCLRHSVQCLVVDKESRKCK 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE5 AIIDHFGQRINAKYFIVEDSYLSEETCSNVQYKQISRAVLITDQSILKTDLDQQTSILIV ::::.::::: ...:.:::::. :. :: :::.::::::::::.:.:::: ::: ::: : CCDS14 AIIDQFGQRIISEHFLVEDSYFPENMCSRVQYRQISRAVLITDRSVLKTDSDQQISILTV 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE5 PPAEPGACAVRVTELCSSTMTCMKDTYLVHLTCSSSKTAREDLESVVKKLFTPYTETEIN : :::. :::: ::::::::::: ::::::::.:::::::::::::.:::.:::: ::. CCDS14 PAEEPGTFAVRVIELCSSTMTCMKGTYLVHLTCTSSKTAREDLESVVQKLFVPYTEMEIE 480 490 500 510 520 530 540 550 560 570 580 590 pF1KE5 EEELTKPRLLWALYFNMRDSSGISRSSYNGLPSNVYVCSGPDCGLGNEHAVKQAETLFQE .:.. :::.:::::::::::: :::: :: :::::::::::::::::..::::::::::: CCDS14 NEQVEKPRILWALYFNMRDSSDISRSCYNDLPSNVYVCSGPDCGLGNDNAVKQAETLFQE 540 550 560 570 580 590 600 610 620 630 640 650 pF1KE5 IFPTEEFCPPPPNPEDIIFDGDDKQPEAPGTNNVVMAKLESSEESKNLESPEKHLQN : :.:.::::::::::::.:::. :::: .. . :. :. .:: :: . :. CCDS14 ICPNEDFCPPPPNPEDIILDGDSLQPEASESSAIPEANSETFKESTNLGNLEESSE 600 610 620 630 640 650 >>CCDS48139.1 CHM gene_id:1121|Hs108|chrX (110 aa) initn: 580 init1: 441 opt: 566 Z-score: 638.4 bits: 125.8 E(32554): 3.1e-29 Smith-Waterman score: 566; 75.2% identity (91.7% similar) in 109 aa overlap (1-109:1-108) 10 20 30 40 50 60 pF1KE5 MADNLPTEFDVVIIGTGLPESILAAACSRSGQRVLHIDSRSYYGGNWASFSFSGLLSWLK :::.::.::::..:::::::::.::::::::.::::.::::::::::::::::::::::: CCDS48 MADTLPSEFDVIVIGTGLPESIIAAACSRSGRRVLHVDSRSYYGGNWASFSFSGLLSWLK 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE5 EYQQNNDIGEESTVVWQDLIHETEEAITLRKKDETIQHTEAFCYASQDMEDNVEEIGALQ :::.:.:: .: : ::: : :.::::.: .::.::::.:.:::: . . CCDS48 EYQENSDIVSDSPV-WQDQILENEEAIALSRKDKTIQHVEVFCYARSTLLL 70 80 90 100 110 130 140 150 160 170 180 pF1KE5 KNPSLGVSNTFTEVLDSALPEESQLSYFNSDEMPAKHTQKSDTEISLEVTDVEESVEKEK >>CCDS7071.1 GDI2 gene_id:2665|Hs108|chr10 (445 aa) initn: 455 init1: 204 opt: 438 Z-score: 486.9 bits: 99.8 E(32554): 8.4e-21 Smith-Waterman score: 438; 24.3% identity (62.3% similar) in 334 aa overlap (226-549:69-392) 200 210 220 230 240 250 pF1KE5 GDKDESKSTVEDKADEPIRNRITYSQIVKEGRRFNIDLVSKLLYSQGLLIDLLIKSDVSR :: .:.::. :.:...: :. .:. ..:.: CCDS70 YGGESASITPLEDLYKRFKIPGSPPESMGRGRDWNVDLIPKFLMANGQLVKMLLYTEVTR 40 50 60 70 80 90 260 270 280 290 300 310 pF1KE5 YVEFKNVTRILAFREGKVEQVPCSRADVFNSKELTMVEKRMLMKFLTFCLEY-EQHPDEY :..:: . .... ::. .:: ..:... :. . . ::: . :::.. .. :. : . CCDS70 YLDFKVTEGSFVYKGGKIYKVPSTEAEALASSLMGLFEKRRFRKFLVYVANFDEKDPRTF 100 110 120 130 140 150 320 330 340 350 360 pF1KE5 QAF--RQCSFSEYLKTKKLTPNLQHFVLHSIAMTS-----ESSCTTIDGLNATKNFLQCL ... .. .. . : : .. :. :..:. .. : . .: : . . : CCDS70 EGIDPKKTTMRDVYKKFDLGQDVIDFTGHALALYRTDDYLDQPC--YETINRIKLYSESL 160 170 180 190 200 210 370 380 390 400 410 420 pF1KE5 GRFGNTPFLFPLYGQGEIPQGFCRMCAVFGGIYCLRHKVQCFVVDKESGRCKAIIDHFGQ .:.:..:.:.:::: ::.:::: :. :..:: : : . .. ..: ..:. .. .. :. CCDS70 ARYGKSPYLYPLYGLGELPQGFARLSAIYGGTYMLNKPIEEIIV--QNGKVIGVKSE-GE 220 230 240 250 260 270 430 440 450 460 470 480 pF1KE5 RINAKYFIVEDSYLSEETCSNVQYKQISRAVLITDQSILKTDLDQQTSILIVPPAEPGAC : .: . ::..... . :. :.. : .. : .:. : .. .:.: . . CCDS70 IARCKQLICDPSYVKDRVE---KVGQVIRVICILSHPIKNTN-DANSCQIIIPQNQVNRK 280 290 300 310 320 490 500 510 520 530 540 pF1KE5 A-VRVTELCSSTMTCMKDTYLVHLTCS-SSKTAREDLESVVKKLFTPYTETEINEEELTK . . : . . . . :.. .. . .: ..... ... :. : . .. .: CCDS70 SDIYVCMISFAHNVAAQGKYIAIVSTTVETKEPEKEIRPALE-LLEPIEQKFVSISDLLV 330 340 350 360 370 380 550 560 570 580 590 600 pF1KE5 PRLLWALYFNMRDSSGISRSSYNGLPSNVYVCSGPDCGLGNEHAVKQAETLFQEIFPTEE :. : CCDS70 PKDLGTESQIFISRTYDATTHFETTCDDIKNIYKRMTGSEFDFEEMKRKKNDIYGED 390 400 410 420 430 440 >>CCDS35452.1 GDI1 gene_id:2664|Hs108|chrX (447 aa) initn: 456 init1: 213 opt: 435 Z-score: 483.5 bits: 99.2 E(32554): 1.3e-20 Smith-Waterman score: 435; 25.2% identity (59.7% similar) in 330 aa overlap (226-546:69-389) 200 210 220 230 240 250 pF1KE5 GDKDESKSTVEDKADEPIRNRITYSQIVKEGRRFNIDLVSKLLYSQGLLIDLLIKSDVSR :: .:.::. :.:...: :. .:. ..:.: CCDS35 YGGESSSITPLEELYKRFQLLEGPPESMGRGRDWNVDLIPKFLMANGQLVKMLLYTEVTR 40 50 60 70 80 90 260 270 280 290 300 310 pF1KE5 YVEFKNVTRILAFREGKVEQVPCSRADVFNSKELTMVEKRMLMKFLTFCLEYEQH-PDEY :..:: : .... ::. .:: ...... :. . : ::: . :::.: ..... : . CCDS35 YLDFKVVEGSFVYKGGKIYKVPSTETEALASNLMGMFEKRRFRKFLVFVANFDENDPKTF 100 110 120 130 140 150 320 330 340 350 360 pF1KE5 QAF--RQCSFSEYLKTKKLTPNLQHFVLHSIAMTS-----ESSCTTIDGLNATKNFLQCL .. . :. . . : .. :. :..:. .. : .. .: : . . : CCDS35 EGVDPQTTSMRDVYRKFDLGQDVIDFTGHALALYRTDDYLDQPC--LETVNRIKLYSESL 160 170 180 190 200 210 370 380 390 400 410 420 pF1KE5 GRFGNTPFLFPLYGQGEIPQGFCRMCAVFGGIYCLRHKVQCFVVDKESGRCKAIIDHFGQ .:.:..:.:.:::: ::.:::: :. :..:: : : . :. ... :.:. .. .. :. CCDS35 ARYGKSPYLYPLYGLGELPQGFARLSAIYGGTYMLNKPVDDIIM--ENGKVVGVKSE-GE 220 230 240 250 260 270 430 440 450 460 470 480 pF1KE5 RINAKYFIVEDSYLSEETCSNVQYKQISRAVLITDQSILKTDLDQQTSILIVPPAEPGAC : .: . ::. ... . :. : . : .. : .:. : .. .:.: . . CCDS35 VARCKQLICDPSYIPDRV---RKAGQVIRIICILSHPIKNTN-DANSCQIIIPQNQVNRK 280 290 300 310 320 490 500 510 520 530 540 pF1KE5 A-VRVTELCSSTMTCMKDTYLVHLTCSSSKTAREDLESVVKKLFTPYTETEINEEELTKP . . : . . . . :.. . . : : . .:. : . . .: .: CCDS35 SDIYVCMISYAHNVAAQGKYIAIASTTVETTDPEKEVEPALELLEPIDQKFVAISDLYEP 330 340 350 360 370 380 550 560 570 580 590 600 pF1KE5 RLLWALYFNMRDSSGISRSSYNGLPSNVYVCSGPDCGLGNEHAVKQAETLFQEIFPTEEF CCDS35 IDDGCESQVFCSCSYDATTHFETTCNDIKDIYKRMAGTAFDFENMKRKQNDVFGEAEQ 390 400 410 420 430 440 656 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 06:41:39 2016 done: Tue Nov 8 06:41:40 2016 Total Scan time: 2.490 Total Display time: 0.050 Function used was FASTA [36.3.4 Apr, 2011]